Kakao Taxi를 통해서 본 빅데이터 분석 with CARTO

지난 5월 30일, 지도로 빅데이터 직관적으로 이해하기 세미나가 열렸습니다. 세미나장에 자리가 모자랄 정도로 많은 관심을 보여주셨는데요. 이번 세미나에는 특별한 외부연사 두분이 함께하여 더욱 유익한 자리였습니다.

<카카오택시에 대해 발표하는 카카오 김상호 님>

PPT 화면에 보이는 귀여운 이모티콘과 상징적인 노란색, 어딘가 친숙하지 않나요? 카카오 모빌리티 데이터 파트의 김상호님의 발표현장입니다. 카카오 모빌리티팀은 이제는 국내에서 대중적으로 널리 사용되고 있는 카카오택시 서비스 관련해 데이터 수집과 분석을 맡고 있는 팀입니다. 자유분방한 카카오의 이미지 처럼 톡톡 튀고 재치있는 발표였는데요. 유익한 발표내용을 조금 더 많은 분들과 공유할 수 있도록 포스팅을 준비했습니다.

카카오택시의 데이터분석 Challenge

4억. 무엇을 의미하는 숫자일까요? 바로 카카오택시의 누적 호출 수 입니다.

호출-취소-배차-취소-승차-하차/신고(!)

위 서비스 흐름에 대한 모든 데이터를 수집한다는 Kakao 모빌리티 팀. 하루 호출 수만 해도 최대 150만건에 다다른다고 하는데요. 이렇게 방대한 시공간 데이터를 어떻게 분석하고 있을까요?

<위치기반 데이터에 활용될 수 있는 툴>

GreenPlum, Hadoop, ArcGIS, QGIS…모두 Kakao 모빌리티 팀에서 데이터 분석에 사용하고 있거나 사용을 검토해 본 기술 및 툴이라고 합니다. 정량적 수치 분석은 병렬 서버로 대용량 데이터를 처리할 수 있는 GreenPlum 등을 통해 비교적 수월하게 수행할 수 있지만, LBS에 필수적인 공간분석의 경우 SQL이나 GIS 툴을 사용해야하는데 솔루션도 제한적이고 어려워 소수의 인력만 활용할 수 있다는 단점을 꼽았습니다.

카카오택시가 CARTO를 만나면?

카카오 정책지원팀은 지난 2016년 11월, 4편에 걸친 카카오 O2O 백서 프리뷰를 발행 했습니다. 모두 카카오택시에서 수집한 데이터로 서비스 성과와 시사점을 분석한 컨텐츠였는데요. 하루동안 발생한 카카오택시 호출 양상, 심야 시간 5대 도시에서 카카오택시의 이동 흐름, 제주도 카카오택시 이용 흐름 등 카카오택시의 위치기반 데이터를 시계열 동영상으로 나타냈습니다.

<CARTO를 시연하는 카카오 김상호님>

이 시각화에서 사용된 분석 플랫폼은 다름아닌  CARTO! 김상호님이 꼽은, 카카오 모빌리티 팀에서 CARTO를 선택한 이유는 아래와 같습니다.

  1. 저비용으로 고품질의 산출물을 생성할 수 있다.
  2. 딱! 필요한 기능들만 제공된다.
  3. PostGIS와 궁합이 잘 맞는다.
  4. Basemap이 아름답다.
  5. UI가 직관적이다.

이와 더불어 CARTO를 직접 적용해 보고 난 소감으로는, 다양한 파일 포맷을 빠르게 시각화 할 수 있고, 시계열 애니메이션으로 간단하게 영상을 제작할 수 있으며 최종 결과물을 url로 편하게 공유할 수 있다는 점을 꼽았습니다. 또한 CSS와 Torque.js를 통해 “예쁘게” 시각화 할 수 있다는 점은 다른 솔루션에서는 찾기 어려운 장점이라고 강조했습니다.

대표적인 위치기반 o2o 서비스인 카카오택시가 CARTO를 통해 데이터를 시각화 하고 비즈니스 결정에 활용한 사례를 직접 엿볼 수 있는 흥미로운 시간이었습니다. 좋은 인사이트를 공유해주신 카카오 김상호 님께 깊은 감사 드립니다!

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.