구글 지도 플랫폼의 온디맨드(On-Demand) 승차 & 딜리버리 솔루션

 

2018년 구글은 전 세계 기업들이 구글 지도를 앱에 통합하여 신뢰할 수 있는 실시간 라우팅을 할 수 있도록 승차 공유 솔루션을 출시했습니다. 그 이후 승차 공유 서비스가 크게 증가했고, COVID-19로 인한 어려움에도 불구하고 이러한 교통의 변화는 당연스러운 현상이 되었습니다. 또한 코로나 이후 배달은 편리함에서 필수가 되었습니다. 구글은 그 이후에도 계속해서 업계에서 가장 큰 규모의 운영자들과 긴밀히 협력하여 급변하는 온디맨드 승차 및 딜리버리 회사의 요구를 해결하기 위한 새로운 방법을 모색해 왔습니다.

2020년 10월에는 새로운 온디맨드 승차 및 딜리버리 솔루션이 출시되었습니다. 15년 간의 세계 지도 제작 경험을 바탕으로 구축된 온디맨드 승차 및 딜리버리 솔루션은 완료된 주행 거리 당 가격 예측과 함께 기업이 운영을 개선하고 예약에서 도착 또는 배송까지의 운전자와 고객 여정을 혁신할 수 있도록 지원합니다. 전과 비교하여 솔루션이 어떻게 향상 되었는지, 새로운 기능들을 함께 살펴봅시다. 

 

 

고객이 필요로 하는 예약 및 주문 정보를 제공합니다 

고객 경험은 고객이 주문을 하려고 앱을 켜는 순간 시작됩니다. 앱의 첫 인상은 고객들에겐 매우 중요합니다 – 만약 고객이 필요한 정보를 얻지 못한다면 아예 주문을 하지 않을 확률이 높겠죠. 그래서 실시간 정보가 중요합니다. 구글의 경로 API를 기반으로 한 선호 경로는 익숙한 구글 지도에서 운전자의 예상 경로 및 도착 예상 시간을 보여줍니다. 선호 경로를 사용하면 오토바이 라우팅 및 사용자 정의된 경로와 같은 주요 기능에 액세스하여 가장 빠른 경로 또는 가장 통행료가 저렴한 경로 등을 볼 수 있습니다.

 

시장 운영을 최적화합니다 

적당한 드라이버를 배치하는 것은 긍적적인 고객 경험으로 이어집니다. Nearby Driver 기능을 통해 더 빠르고 경로에 맞는 드라이버를 찾을 수 있습니다.  Nearby Driver 앱 내 내비게이션과 완전히 연동되어 자동으로 드라이버 위치를 갱신하고, 한 번의 API 호출로 가장 가까운 픽업 장소를 찾을 수 있습니다. 실시간 교통량 및 커스텀 랭킹 기능과 함께, Nearby Driver는 서비스 지역의 고유한 요구에 맞는 시장 효율을 극대화할 수 있습니다. 

 

드라이버 경로와 경험을 개선합니다

이제 온디맨드 승차 & 딜리버리 솔루션으로 가능해진 앱 내 내비게이션은 드라이버 앱과 내비게이션 사이를 왔다갔다 하면서 발생하는 비효율성을 없애줍니다. 내장 내비게이션을 통해 드라이버 경험을 향상시킬 수 있고 헤더, 푸터, 버튼, 마커 등을 변경하여 룩앤필을 커스터마이징할 수도 있습니다. 드라이버는 효율적으로 경로나 중요한 배달 등을 관리할 수 있고, 앱 내에서 경고 알림 등을 받을 수 있습니다. 경로 우회나 경로 유지 등의 기능을 통해 픽업과 배달지 경로를 최적화할 수도 있습니다. 이는 결국 더 많은 배달과 더 높은 고객 만족도로 이어집니다. 

 

드라이버 경로와 진행 상황을 시각화합니다

온디맨드 세계에서 드라이버의 위치를 파악하는 것은 매우 중요합니다.  Trip & Order Progress를 통해 고객의 현재 위치, 경로 및 도착 예정 시간을 실시간으로 확인할 수 있습니다. 또한 변화하는 도착 예정 시간을 상황별로 파악하는 데 도움이 되는 트래픽 조건도 확인할 수 있습니다. 이제 고객은 운전자가 어디에 있는지 걱정할 필요가 없으며, ‘배달이 올 때 내가 집에 없으면 어떡하지’ 하는 고민도 할 필요가 없어졌습니다. 고객에게 필요한 실시간 정보를 제공하면 문의 전화가 줄어들고, 배달 취소도 감소하게 됩니다. 

 

구글 지도를 통해 드라이버 픽업 속도를 20%나 향상 시킨 Gojek

인도네시아의 첫 유니콘 기업 Gojek은 교통 체증이 심한 인도네시아의 특성을 잘 반영한 공유 차량 서비스입니다. 오토바이 호출 서비스로 시작하여 지금은 딜리버리 서비스를 포함한 20개 이상의 서비스를 제공하는 원스톱 플랫폼(“슈퍼앱”)으로 성장했죠. Gojek의 목표는 고객과 상품,서비스 공급자를 연결하여 삶의 일상적인 마찰을 제거하는 것입니다. 

Gojek은 구글과의 파트너십을 통해 Gojeck 소비자와 드라이버를 위한 앱 환경을 개선했습니다. 구글 지도 플랫폼의 라우팅 기술을 활용하여 더 나은 앱 내 내비게이션 시스템을 만들어, 더 이상 운전자들이 자신의 지식에 의존하는 것이 아니라 데이터에 기반하여 움직이도록 했습니다. 

또한 고객들이 앱에서 드라이버의 실시간 위치, 경로, 도착 예상 시간을 볼 수 있게 하여 고객과 드라이버 간의 마찰을 줄였습니다. 

Gojek은 구글 지도 플랫폼의 온디맨드 승차 & 딜리버리 솔루션을 통해 신호 품질이 떨어지거나 도로 상황이 좋지 않은 곳에서도 정확한 운전자 위치를 파악할 수 있게 되었다고 말했습니다. 구글 지도의 지속적인 업데이트는 끊임없이 변화하는 딜리버리와 승차 환경에도 아주 적합하여, 앞으로가 더욱 기대됩니다. 

 

 

SPH는 Maxar Technologies, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.

 

Mapbox는 Maxar의 Vivid Basemap을 Global Foundational Imagery Layer로 추가하였습니다!

모바일 및 웹 애플리케이션을 위한 위치 데이터 플랫폼인 MAPBOX는 Maxar Technologies(맥사 테크놀로지)의 생생한 기본의 1억 3천 5백만 평방 킬로미터 업로드 되는 기본 맵을 매핑 플랫폼에 사용하는 것과 관련하여 Maxar와 새로운 계약을 하였습니다. Maxar는 플랫폼의 유일한 상업용 위성 이미지 제공 업체입니다. 이것은 현재까지 Mapbox의 가장 큰 이미지 구매이며, 위성 이미지 레이어가 얼마나 최신이고 일관적인지에 대한 주요 발전을 나타냅니다. Maxar의 위성 이미지 및 영상은 Mapbox 뿐만 아니라 google Maps, Google Earth, HERE Maps 에서도 사용 중입니다.

 

주요 Maxar 제품인 Vivid Basic은 지리적 컨텍스트를 위한 맵 레이어가 필요한 응용 프로그램 및 장치에 대한 이미지 통용 및 시각적 미학의 최적 균형과 함께 50cm 해상도를 제공하는 글로벌 이미지베이스 맵입니다.

Mapbox의 CEO 인 Eric Gundersen은 “Maxar의 Vivid Basic 베이스 맵을 매핑 플랫폼에 통합함으로써 고객을 위한 인터렉티브형 지도 경험을 혁신 할 수 있습니다. Vivid Basic의 해상도와 시각적 품질은 활주로 표시 읽기, 자동차 및 선적 컨테이너 계산, 건설중인 건물 내부 들여다보기, 드라이브 탐색, 하이킹 또는 라이딩 계획까지 다양한 사용 사례를 고객에게 제공합니다.”라고 말했습니다.

 

Mapbox는 이미 이 이미지를 모든 사용자에게 배포하고 있으며 업그레이드는 몇 주 내에 완료됩니다. Mapbox에 Vivid Basic의 추가 기능이 얼마나 큰지 알아 보려면 다음과 같은 과거 발표를 확인하세요.

Vivid Basic이 Mapbox의 지도를 개선하는 방법에 대한 자세한 내용을 Mapbox 블로그에서 가져와보았습니다. (출처: https://www.mapbox.com/blog/3d-satellite-maps-high-res-imagery)

a little of Antarctica and Greenland

Mapbox의 새로운 데이터는 Maxar의 WorldView 인공위성에서 가져온 것입니다. Maxar의 WorkdView는 외부에 있는 동종의 가장 진보된 고해상도 지구 관측 장비입니다. 데이터의 규모를 파악하기 위해 Maxar의 WorldView-3 위성은 매일 프랑스 전체를 커버 할 수 있는 충분한 이미지를 수집 할 수 있습니다. 그리고 이것은 Maxar의 글로벌 이미지베이스 맵 인 Vivid Basic의 이미지를 수집한 여러 고급 위성 중 하나 일뿐입니다. Vivid Basic은 기본 해상도가 50cm입니다.

Maxar는 또한 많은 사용 사례를 지원하는 데 필요한 품질과 정확성을 제공하는 계층화된 Vivid베이스 맵 세트로 Vivid 제품 라인을 계속 발전시키고 있습니다. 3D 기능 과 함께 Maxar는 최고 품질 및 최대 규모의 위성 이미지 제품으로 업계를 계속 선도하고 있습니다.

SPH는 Maxar Technologies, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.

딥 러닝은 사람의 정확도와 동등하게 Maxar 위성 이미지에서 코끼리를 감지합니다.

새해의 첫 컨텐츠는 Maxar Technologies (맥사 테크놀로지) 이야기를 하려고 합니다. 저희 SPH는 맥사 테크놀로지의 한국 파트너사로써 센티미터급 정확도를 가진 위성 영상공급, 영상처리기술을 통한 분석솔루션과 클라우드 기반 다양한 아카이빙 정보와 솔루션을 한국 기업들에 제공하고 있습니다. 최근에 아크인베스트의 스타 투자자 캐시우드가 우주산업 상장지수펀드를 내놓겠다고 예고해서 맥사 테크놀로지도 덩달아 엄청난 주목을 받고 있습니다. 맥세 테크놀로지의 퀵 버드, 월드 뷰 위성으로 획득한 위성영상은 지구 전체 98% 커버리지와 과거부터 현재까지 5억평방km 이상을 서비스로 제공하고 있답니다.

편집자 주 :이 블로그 게시물은 2019 년 3 월에 게시 된 ” 새로운 야생 동물 조사 기술 : 위성 이미지 및 머신러닝을 사용하여 코끼리 탐지 및 모니터링 “에 대한 업데이트입니다.

아프리카 코끼리 (Loxodonta africana)의 개체수는 밀렵, 농작물 습격에 대한 보복 살인, 서식지 분열로 인해 지난 세기 동안 급감했습니다. 이 코끼리를 보호하려면 코끼리의 위치와 존재 수를 알아내는 정확한 모니터링이 중요합니다. 기존 방법은 오류가 발생하기 쉽습니다. 부정확 한 계수는 부족한 보전 자원을 잘못 할당하고 개체 추세를 오해하게합니다.

현재 사바나 환경에서 코끼리 개체 수에 대한 가장 일반적인 조사 기술은 유인 항공기의 항공 계수입니다. 그러나 항공 측량에 대한 관찰자는 지쳐서 시야가 좋지 않아 방해를 받거나 편견에 굴복 할 수 있습니다. 또한 항공 측량은 비용이 많이 들고 물류적으로 어려울 수 있습니다.

야생 동물 보호 연구 유닛 및 머신 러닝 연구 그룹의 옥스포드 대학 연구원으로서 우리는 Maxar의 WorldView-3 위성 이미지 및 딥 러닝 (TensorFlow API, Google Brain)을 사용하여 인간 감지 기능과 비슷한 정확도로 우주에서 코끼리를 감지했습니다. 이 방법은 또한 다양한 기존 문제를 해결합니다.

Maxar 위성 (위에 표시된 WorldView-3)은 단 몇 분 동안 한 번의 패스로 5,000km² 이상의 이미지를 수집 할 수 있으므로 이중 계산의 위험을 제거하고 짧은 간격으로 반복 조사를 할 수 있습니다. 이 눈에 잘 띄지 않는 기술은 지상이 필요하지 않으므로 동물이 방해받지 않으며 데이터 수집 중에 인간의 안전이 위험하지 않습니다. 이전에 접근 할 수 없었던 지역은 접근이 가능하며, 종종 보전 계획에 중요한 국경을 넘는 지역은 육상 허가를 얻기 위해 시간이 많이 소요되는 요구 사항없이 조사 할 수 있습니다.

우리는 딥 러닝을 활용하여 엄청난 양의 WorldView-3 데이터를 수작업으로 정렬하는 데 몇 달이 걸리던 대신 몇 시간 만에 처리했습니다. 딥 러닝 알고리즘은 오류, 거짓음성 및 거짓양성 가능성이 적은 일관된 결과를 생성합니다. 또한 모델을 체계적으로 개선하여 수정 될 수 있습니다.

이 방법을 개발하기 위해 남아프리카에서 1,000 마리 이상의 코끼리에 대한 커스터마이즈된 훈련 데이터 세트를 생성하고 이를 CNN (Convolutional Neural Network)에 공급했습니다. 그런 다음 그 결과를 인간의 성과와 비교했습니다. 2019년 3월 블로그 게시물 에서 우리가 어떻게 훈련 데이터 집합을 생성하고, CNN을 훈련하는 방법을 설명했습니다.

이제 우리 작업의 결과를 공유하게되어 자랑스럽습니다. CNN은 인공위성 이미지에서 인간 감지 능력만큼 높은 정확도로 코끼리를 감지 할 수 있습니다. CNN 모델의 결과 (F2 점수로 알려짐)는 이기종 영역에서 0.78, 동질 영역에서 0.73이었으며, 이종 영역에서 평균 0.77 점, 균일 영역에서 0.80 점의 인간 탐지 능력 F2 점수를 받았습니다. 모델은 모델의 일반화 가능성을 보여주는 훈련 데이터 사이트에서 멀리 떨어진 곳에서 코끼리를 감지 할 수도 있습니다. 성인 코끼리에 대해서만 기계를 훈련 한 후에 송아지를 식별 할 수있을 것입니다.

왼쪽 이미지에서 모든 코끼리를 발견 할 수 있는지 확인한 다음 결과를 CNN이 찾은 결과와 비교하여 빨간색 및 녹색 상자로 강조 표시한 것입니다.

우리는 이것이 보존 목적에 기여하는 현대 기술의 힘을 입증한다고 믿습니다. 위성 원격 감지 및 딥 러닝 기술은 이 장엄한 포유류에게 더 안전한 삶을 약속합니다. 보존 기술은 여섯 번째 대량 멸종과 전 세계 생물 다양성의 곤경에 필요한 시급함을 수용 할 수있는 새로운 가능성의 세계를 열어주고 있습니다.

 

SPH는 Maxar Technologies, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.

다사다난했던 2020년 사람들에게 가장 많이 사랑받았던 gis 컨텐츠는!?

이제 어느새 2020년은 딱 일주일 정도 남았습니다. 2020년을 되돌아보니…도대체 무엇을 했는가? 라는 생각이 제일 먼저 떠오르더라구요. 매년 갔었던 GTC 중국 출장도 없었고..코엑스에서 매년 구글지도 부스를 이쁘게 꾸며서 참가했던 Google Cloud Summit도 없었고… 오프라인 세미나들의 기억도 없고.. 제 개인적으로 매년 가던 발리도 안갔다오니… 마스크를 사고 마스크를 쓰고.. 걱정 반 두려움 반으로 2020년이 그냥 지나가버렸더라구요. 하지만 오늘 저는 지난 2020년동안 오프라인 행사는 못했지만 대신에 좀 더 SPH를 관심있게 지켜봐주시는 분들을 위해서 노력과 시간을 더 들여 만든 데이터분석 및 gis 관련 컨텐츠들을 쭉 돌이켜보았답니다. 사람들에게 가장 많이 사랑을 받았던 SPH 컨텐츠들 TOP5를 정리해보면서 올해를 마무리해 보려고 합니다. 내년은 좀 더 활발하게 오프라인 세미나도 하고 컨퍼런스나 서밋들도 참여해서 이쁘게 부스만들어서 고객사분들을 더 가까이서 뵙기를 희망하면서요!


[TOP5] 구글맵 마커 클러스터링 하는 방법

지리 정보를 쉽게 사용할 수 있는 형태로 표시하려면 지도를 사용해야 합니다. 그러나 사용자가 더 많은 정보를 탐색하기 위해서는 큰 그림을 빠르게 전달하고 한 눈에 이해할 수 있는 지도가 필요합니다. 수백 개의 데이터 포인트가 모여있으면 정확도가 떨어집니다. 이 포스팅에서는 JavaScript의 마커 클러스터러 라이브러리를 사용하여 모든 마커가 겹치지 않고 동일한 정보를 집계하여 전달하는 방법을 다루었습니다.


[TOP4] 내 연소득으로 살 수 있는 아파트, 어디에 있을까? (+중소기업 신입이 서울에 아파트를 사려면 몇년이 걸릴까?)

이 포스팅은 많은 사람들이 관심을 가질 분야인 부동산에 대해 국내 최고의 GIS분야 연구실인 서울대 GIS/LBS 랩과 함께 협업을 한 포스팅입니다. 전국을 대상으로 내 집(아파트)을 사기 위해 벌어야 하는 최소 연소득을 지역별로 보여주는 지도를 만들어 보았습니다. 이 지도를 통해 각자 자신의 연소득으로 살 수 있는 아파트가 어디에 있는지 찾아볼 수 있습니다. 아무래도 ‘부동산’ 키워드가 2020년의 핫키워드인만큼 많은 사람들이 이 컨텐츠를 관심있게 봐주셨답니다.


[TOP3] 스타벅스 DT 소셜 데이터를 이용한 감성분석

코로나 이후의 시대인 ‘뉴노멀’ 시대에는 접촉을 피하면서 기존 문화를 즐기려고 하는 시대이기 때문에 코로나 영향으로 기존 흐름에 큰 변화가 생겼습니다. 사람들은 차를 타고 근교로 드라이브하거나 접촉을 최대한 피하는 액티비티를 즐기려고 하는 트렌드에 맞춘 새로운 비즈니스 모델이 필요한 상황입니다. 스타벅스DT 이용고객의 리뷰, ‘입소문’ 분석을 통하여 감성분석을 해보았던 컨텐츠입니다. SPH 데이터 컨설팅 팀이 심여를 기울여서 2부로 나눠서 제작한 스타벅스 DT 데이터분석은 링크드인에서도 사람들의 사랑을 가장 많이 받았던 컨텐츠였답니다.


[TOP2] 28년만에 가장 높은 총선 투표율! 21대 국회의원 선거결과 지도로 ‘시각화’하여 보기 !!

이 포스팅을 보면서 아! 2020년에 국회의원 선거투표도 했었구나! 떠오르더라구요.. 마스크끼고 장갑끼고.. 투표했던 기억..이러한 것들을 잘 따르고 무탈하게 투표를 마쳐 28년만에 가장 높은 투표율 66.2% 을 기록하였던 2020년 21대 국회의원 선거.. 기존에 미디어에서 다루고 있는 개표 결과 지도는 어쩌면 2차원적이고 상세하고 방대한 데이터를 한 번에 시각화하기에는 한계가 있다고 생각을 하고 있던 중에 CARTO로 21대 국회의원 선거 결과의 방대한 데이터를 지도에다가 깔끔하게 시각화해본 것을 녹여낸 컨텐츠였답니다.


[TOP1] 확진자 이동경로를 지도에 시각화한 ‘코로나 맵’ 링크들을 모아보았어요.

2020년 가장 많이 사람들이 관심을 보여준 TOP1 컨텐츠는 역시나 ‘코로나’관련 컨텐츠였습니다. 더 놀라운건.. 이때 제가 포스팅을 한게 2월이었는 데 이때 확진자가 16명이었나 보네요.. 지금은 매일 1000명 가까운 확진자들이 나타나고 있어서 사람들에게 공포감과 불안감을 주고있구요. 지금 여기에 소개해드린 ‘코로나맵’은 아직도 활발히 업데이트가 잘되고 있지만 나머지 ‘코로나알리미’와 ‘유바이러스’는 서버가 닫혀있네요.

 

 

이렇게 사람들에게 관심을 많이 받은 컨텐츠들을 정리하면서 하나하나 다시 읽어보니.. 2020년 역시나 다사다난했었군요. ‘코로나 바이러스’로 인해서 뉴노멀, 언택트 등 관련한 것들의 큰 변화가 생겼습니다. 예를들면, 온라인 강의, 재택근무 등과 같이 머나먼 미래에나 전면 시행될 것 같은 것들이 갑자기 일상에 한 부분이 되버리게 되었고.. 어쩌면 소모성보다는 좀 더 가치있는 본질에 집중을 하게되는 업무 환경이 되기도 하였습니다. 또한 코로나뿐만 아니라 이전과는 다른 기후변화때문에 지구온난화, 기후위기, 비건 등에 대한 관심도도 더욱 커졌습니다.
 
저 또한 이번 2020년은 어떻게 생각해보면 너무나 허무(?)하다고 느껴지기도 하지만 코로나로 인한 공포감과 불안감으로 인해 저에게 소소했던 일상의 소중함을 너무나 크게 일깨워주었던 한 해였습니다. 아프지 않고 건강하게 잘 먹고 잘 자고 잘 쉬고 잘 일하고 .. 이러한 것들이 얼마나 소중한 것인 지 다시 한번 깨닫고 생각하면서 이번 포스팅을 마무리해보려 합니다. 


SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.

최우수상 받은 데이터 컨설팅팀, 숨은 뒷이야기!

서울시 빅데이터 캠퍼스 공모전 최우수상 수상!

참여부터 수상까지의 숨은 뒷이야기

 

  • 소개
  • 공모전 주제 선정 
  • 공모전 기획  
  • 데이터 수집 및 ETL 
  • 데이터 분석
  • 데이터 분석 결과 – 어린이 보호 구역으로 지정되어야 하는 3곳!  
  • 잠깐! 토막 소식
  • 아쉬운 점 및 챌린지 
  • 수상 결과에 대한 의견 및 소회

 

  • 소개

서울시 빅데이터 컨퍼런스에서 김도환 전임 연구원의 발표 모습

서울시 빅데이터 컨퍼런스에서 김도환 전임 연구원의 발표 모습

안녕하세요! SPH 데이터 컨설팅팀이 이번 2020 서울시 빅데이터 캠퍼스에서 주최한 빅데이터 공모전에서 최우수상을 수상하였습니다. 이번 공모전은 주제 선정에서부터 수상까지 의미있고 재미있었던 부분들이 많았는데요. 공모전 주제 선정에서부터 수상까지 SPH 데이터 컨설팅팀의 전문적인 분석 과정과 노력등을 공유해 드리려고 합니다.      

 

  • 공모전 주제 선정

최종으로 선정된 주제: 新 어린이 보호구역 제안 

서울시 빅데이터 캠퍼스에서 주최한 공모전은 예전부터 관심이 많이 있던 공모전입니다. 다른 주최사와 달리 사용 가능한 데이터, 즉 빅데이터를 기반으로 분석을 자유롭게 할 수 있다는 점에서 꼭 참여하고 싶었습니다. 주제 선정에 있어서는 꽤나 고심을 많이 했는데, 그 이유는 SPH 데이터 컨설팅팀은 사회 전반에 걸쳐 여러 주제에 관심이 많기 때문입니다. 예를 들어, ‘흡연 구역 설정’, ‘최적의 따릉이 구역’처럼 사회적으로 충분히 도움이되는 분석 결과를 내놓는다면 좋겠다라는 생각을 하고 있었습니다. 또한 양질의 데이터의 유무가 중요하다고 생각하는데요. 분석하고자 하는 주제가 굉장히 좋아도 데이터가 충분하지 않다면 분석 결과의 신뢰도에도 영향을 미치기 때문입니다.

저희는 어린이 교통사고에 관한 뉴스들을 다수 접하면서 ‘어린이 보호구역’에 대해 관심을 갖게 되었고 관련 데이터가 서울시 및 여러 기관에서 제공하는 것을 확인한 뒤에 최종으로 이 주제를 선정하게 되었습니다. 또한 현재 어린이 보호구역은 어떠한 특징과 법안이 있는 지 살펴 보았는데, 생각보다 허점이 있다는 것을 알게 되면서 데이터 분석 및 기획을 시작하게 되었습니다. 

 

  • 공모전 기획 

프로젝트 소개부터 결과까지의 과정 

 

빅데이터를 이용한 분석도 중요하지만 데이터 분석가로서 중요한 역량 중 하나인 상호 커뮤니케이션, 즉 설득력있는 기획을 어떻게 진행할 것인지에 대해 고민을 했습니다. 아무리 분석을 잘해도 사람들이 이해하기 쉽지 않다면 분석한 결과의 가치가 많이 떨어지기 때문에 분석에 ‘스토리’를 담아 PPT에 녹여냈습니다. 

이 주제를 선정한 배경, 사회적 상황, 어린이 보호구역의 현재 법률적 효력 등 사회적 이슈와 現 어린이 보호구역 기준의 변화에 대한 긍정적인 결과 순으로 PPT에 담아내려 노력했습니다. 또한 ‘당위성’이 중요한 부분이라 생각하였습니다. 저희가 특정 데이터를 수집 및 이용한 이유, 데이터 분석에서 머신 러닝 모델을 이용한 이유와 결과물에 대한 심도있는 해석까지 포함한 내용이 들어있습니다 (아래 발표영상 링크 참고). 빅데이터 분석으로 끝나는 게 아닌, 적재적소에 이 분석 결과가 사용되길 바라는 마음을 담아내어 기획을 했습니다.  

   

  • 데이터 수집 및 ETL

어린이 교통사고 현황 [출처: TASS 교통사고 분석 시스템] 

어린이 교통사고 데이터는 TASS에서 지난 6년 간의 데이터를 수집할 수 있었기 때문에, 꽤 양질의 데이터를 모을 수 있었습니다. 또한 서울시 빅데이터에서 제공하는 SKT 유동인구 데이터를 통해 10대 유동인구의 이동 동선을 확인할 수 있었으며 초등학교 및 유치원, 그리고 어린이 보호구역 현황은 서울시 열린 데이터 광장(https://data.seoul.go.kr)에서 수집했습니다. 

‘데이터 분석의 꽃은 전처리’라는 말이 있을 정도로 저희 SPH 데이터 컨설팅팀은 데이터 전처리에 많은 노력을 기울였습니다. 어떠한 데이터를 추출하고 필요하지 않는 데이터는 어떻게 보관할 것이며, 중요한 데이터 중 어느 변수를 원 핫 인코딩 처리 할 것인지, 그리고 결측치 처리 및 Outlier 처리에 관련하여 많은 노력을 들였습니다.  

 

 

  • 데이터 분석

데이터 수집부터 분석 결과까지의 과정을 시각화한 차트

지도 학습 및 비지도 학습 등 여러 분석 방법들이 있는데 저희는 ‘어린이 교통사고 건수’라는 Target 값이 있었기 때문에 지도 학습으로 진행하였습니다. 또한 여러 전문적인 머신러닝 회귀 모델들이 많았는 데, 이번 분석에서는 머신러닝의 모델을 이용했습니다. 모델 중 최적 모델 선택에 있어서는 MAE (Mean Absolute Error)을 기준으로 가장 낮은 오류 값을 가진 모델이 성능이 좋은 모델이라 판단하였습니다. 저희의 분석 결과로는 10개의 모델 중 Random Forest Regressor가 가장 최적의 모델로 선정되었습니다.    

Random Forest Regressor는 앙상블 회귀 모델로써 MAE가 0.08의 가장 낮은 오차값을 가지고 있습니다. 이 모델이 선정한 중요 변수와 Pearson Correlation에서 중요 변수로 제시된 변수들은 ‘10대 유동인구’,’주변 유치원 수’, ‘주변 초등학교 수’입니다.  (아래 사진 참고)

 

머신 러닝 모델이 선택한 중요 변수들 및 필터링 과정

 

저희 공모전 주제는 데이터 분석 관점이 두 가지로 나뉩니다. ‘현황 분석’과 ‘예측 분석’. 현황 분석과 예측 분석으로 나뉜 이유는 1.현재 문제점을 조금 더 정밀히 파악하고 어린이 보호구역 기준의 미흡함에 대해 경각심을 주기 위함2.현재는 알 수 없지만 예측을 통해 머신 러닝 분석 결과에 기반하여 미래 사고 위험도를 알려주기 위함이었습니다. 

현황 분석은 데이터 분석을 통해 알게된 중요 변수들을 통해 필터링을 하여 어린이 보호구역으로 설정되진 않았지만 설정되어야 하는 곳들을 나열했습니다. 중요 변수들은 ‘초등학교 수’, ‘유치원 수’, ‘10대 유동인구 수’였는데 이 값들에 특정 기준치 이상일 경우 현재 어린이 보호구역으로 선정되어야 하는 구역을 나열했습니다. 특정 기준치는 ‘10대 유동인구 수’는 상위 10%값, 유치원 수는 1곳 이상, 초등학교 수는 2곳 이상으로 이 모든 기준치에 부합되는 장소인데 어린이 보호구역으로 선정되지 않았으며 사고 수가 5건 이상인 경우인 장소는 로드맵을 통해 실제 어린이 보호구역으로 어느 장소까지 보호되는지 살펴보았습니다. 

예측 분석은 말 그대로 머신러닝 알고리즘이 예측한 사고 건수입니다. 예를 들어 사고가 1건이 일어난 장소들을 Test Set(216건)으로 선정하여 현황 분석때 이용한 머신러닝 모델을 통해 이 장소들이 향 후, 얼마나 사고 건수가 상승하는 지 살펴봤습니다. 그 중 43곳은 사고 발생 건수가 2건 이상이었으며 이 점을 토대로 어린이 교통 사고가 일어날 확률이 높으니 지정이 반드시 필요하다라는 점을 피력했습니다. 

 

  • 데이터 분석 결과 – 어린이 보호구역으로 지정되어야 하는 3곳!

빅데이터 및 AI를 통해 알아낸 어린이 보호 구역 지정으로 시급한 TOP3 지역

데이터 분석 결과 중 현황 분석을 통한 결과를 보여드리자면, 가장 어린이 보호구역으로 지정되어야 되는 시급한 곳은 1. 석촌 호수로 잠실 새내역 사거리 2. 내발산동 강서로 47길 3. 구로구 개봉동 179-46으로 나타났습니다. 어린이 교통사고가 5건 이상 발생되며 초등학교 및 유치원이 주변에 위치하며 10대 유동인구가 상위 10% 이상 존재하는 장소임에도 불구하고 어린이 보호구역으로 지정되지 않은 곳입니다.

어린이 보호 구역 지정으로 시급한 TOP3 지역의 실제 사진 및 사고 현황

석촌 호수로 잠실 새내역 사거리인 경우는 반경 400m 지점까지 어린이 보호구역이 없었으며, 구로구 개봉동 179-46과 내발산동 강서로 47길 3은 어린이 보호구역이 존재하나 그 주변에서 일어나는 어린이 교통사고가 존재하는 것으로 보입니다.  현재 법령으로는 볼 수 없지만 빅데이터 및 AI를 통해서 찾을 수 있는 ‘사각 지대’입니다.  (자세한 분석 내용은 아래 자료 공유를 참고해주세요)

 

  • 잠깐! 토막 소식 

어린이 보호구역 지정에 대한 염원이 서울시에 닿았는지, 최근 잠실 학원 사거리에 기존에 없던 어린이 보호구역 및 30km 속도 제한 과속 카메라가 설치되었습니다. 저희 데이터 분석 결과였던 어린이 보호 필수 구역 1위로 선정된 곳에 CCTV 설치 및 어린이 보호 구역으로 지정이 되어 이 근방의 어린이 교통사고 예방에 긍정적인 변화가 있을 것으로 예상됩니다! 아래 사진은 SPH 조영만 차장님께서 어린이 보호구역 지정에 대한 기쁜 마음을 담아 공유해주신 사진입니다.

최근 잠실 학원 사거리에 설치된 어린이 보호구역 및 과속 카메라 모습

 

  • 아쉬운 점 및 챌린지 

서울시 빅데이터 캠퍼스에 참여하게 되면서 느낀 점 중 아쉬웠던 부분은 데이터의 불균형입니다. 예를 들면 서울시 빅데이터 캠퍼스이지만 사실상 대한민국을 대표하는 빅데이터 캠퍼스이기 때문에 분석 주제가 서울시로 국한되지 않습니다. 하지만 서울시 외의 데이터들은 잘 갖추어있지 않거나 양질의 데이터가 많지 않다보니 자연스럽게 분석 타겟이 서울 시내로 맞춰지는 게 조금 아쉬운 부분이었습니다. 대한민국 내의 행정에 관련된 데이터들이 한 곳에 잘 정리되어 있다면 소외된 지역에 관한 효율적인 빅데이터 분석이 가능하지 않을 까 싶습니다.   

 

  •   수상 결과에 대한 의견 및 소회

2020년 저희 데이터 컨설팅팀이 사회 이슈에 대해 열심히 분석하고 관심을 갖게 된 것에 대한 ‘선물’이라고 생각합니다. 다른 공모전 팀들도 분명히 필요한 뜻깊은 분석을 하였으며 공모전 참여만으로도 다른 팀들의 분석 인사이트를 보면서 배울 점이 많았습니다. 서울시 빅데이터 캠퍼스 사옥에도 방문해보고 공공 데이터가 어떻게 관리되는 지 배우는 시간이었습니다. 또한 저희 뿐만 아니라 많은 참가자들이 빅데이터 분석에 크게 관심을 갖는 것을 볼 때, 미래에는 정말 빅데이터를 통해 과거보다 더 도움이되는 정책들이 나오지 않을 까 기대됩니다. 저희 SPH 데이터 컨설팅팀은 사회적 이슈 및 여러 공공 사안을 비롯하여 흥미로운 주제들로 인사이트있는 분석을 가지고서 다시 찾아뵙겠습니다. 감사합니다.

  

서울시 빅데이터 캠퍼스 최우수상 시상식 

Blog written by 이소린 전임 연구원

 

김도환 전임 연구원 발표 영상 및 분석 자료 다운로드: 


SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.

[Google Maps 이야기] AI와 항공 이미지로 나무 그늘 만들기

“나무를 심기 가장 좋은 때는 20년 전이었고, 두 번째로 좋은 때는 바로 지금이다.”라는 속담을 들어보셨을 겁니다. 지구온난화가 큰 문제가 되고 있는 요즘, 전세계의 정책 입안자와 도시는 더 많은 나무를 심으려 노력하고 있습니다.

콘크리트와 인프라가 열섬을 형성하고 있는 도시에서는 극한 기온이 점점 더 빈번해지고 있습니다. 온도가 너무 높아져서 공기가 나빠지고, 탈수 및 기타 공중 보건 문제가 발생하는 것이죠. 나무 심기는 거리 수준의 온도를 낮추는 동시에 삶의 질을 향상시키는 해결책으로 점점 더 주목받고 있습니다. 그러나 많은 도시들은 나무가 어디에 심어져 있는지, 어디에 나무를 추가로 심으면 좋을지를 계획하기 위한 예산이나 자원을 가지고 있지 않습니다.

Tree Canopy Lab을 통해 구글은 AI와 항공 이미지를 결합하여 도시가 현재 나무 커버리지를 보고 향후 나무 심기 프로젝트를 계획할 수 있도록 지원하고 있습니다. 현재는 로스엔젤레스 지역만 지원하고 있으며, 더욱 넓혀나갈 예정입니다.

Tree Canopy Lab은 LA의 나무들을 볼 수 있습니다. 예를 들어 동네의 몇 퍼센트가 나무가 많은 곳이고, 인구 밀도가 높은 지역은 어디이며, 어떤 지역이 극심한 더위에 취약한지 등과 같은 지역적인 차원에서 나무들을 확인할 수 있습니다.

Tree Canopy Lab은 도시들이 탄소 배출과 오염을 측정 및 계획하고 줄일 수 있는 도구인 Environmental Insights Explorer 내에 있습니다. 이 플랫폼은 수백 개의 지방 정부가 기후 변화에 맞서 싸우는 것을 돕기 위해 만들어졌습니다.

누구나 태블릿이나 노트북으로 Tree Canopy Lab애 접속할 수 있습니다

 

도시 입업 계획을 위해 나무 커버리지 매핑하기

봄, 여름, 가을철 수집한 항공사진과 구글 AI, 구글 어스 엔진의 데이터 분석 기능을 통해 도시의 모든 나무를 정확히 찾아내고 그 밀도를 측정할 수 있습니다. 우리가 이러한 계산에 사용하는 이미지에는 하늘에서 도시를 내려다보는 각도의 컬러 사진도 포함됩니다. 도시의 나무 커버리지에 대해 더 자세한 정보를 얻기 위해, 근적외선 사진이 육안으로 볼 수 없는 색상을 감지하고 다양한 각도에서 이미지를 비교하여 하이트 맵을 만듭니다.

 

 

그런 다음 이미지를 자동으로 스캔하고 나무의 존재를 감지한 다음 “나무 캐노피”라고도 불리는 나무 감지 AI를 활용하여 나무의 밀도를 보여줍니다.

이 도구를 사용하면 비싸고 시간이 많이 드는 나무 연구에 의존할 필요가 없습니다.

정책 입안자부터 이웃에 이르기까지, 누구나 Tree Canopy Lab에서 로스앤젤레스를 탐험하고 통찰력을 얻을 수 있습니다. 예를 들어 나무를 심으면 좋을 주거용 블록을 식별하고 낮은 캐노피 커버리지로 인해 폭염에 취약한 동네를 찾는 데 도움을 줄 수 있습니다.

 

 

Tree Canopy Lab을 통해 우리는 안젤레노스 인구의 50% 이상이 나무 커버리지가 10% 미만인 지역에 살고 있고, 44%가 열 위험이 매우 높은 지역에 살고 있다는 것을 발견했습니다. 또한 로스엔젤레스의 열 위험이 가장 낮은 지역은 나무 커버리지가 가장 높다는 상관관계를 볼 수 있습니다. 이 지역들은 안젤레노스에서 가장 인구 밀도가 낮은 곳이기도 했습니다.

 

 

새로운 환경 인사이트로 도시 연결하기

로스엔젤레스는 지속가능성을 목표로 할 뿐아니라, 기후 변화로 점점 기온이 올라감에 따라 주변 지역을 미화하고 대기질을 향상시키기 위해 도시 임업에 꾸준히 투자해 왔습니다.

2021년까지 9만 그루의 나무를 심고 503평방 마일 이상의 도시 전역에 매년 2만 그루 이상의 나무를 심는다는 목표를 달성하기 위해, Tree Canopy Lab은 도시 전역의 사람들을 돕고 있습니다. 이웃과 공동체 단위에서부터 에릭 가르세티 시장, 그리고 도시 최초의 산림 관리인 레이첼 말라리히에 이르기까지, 모두 도시의 나무들이 어디에 있고 더 많은 녹지가 필요한 곳이 어디인지 확인할 수 있습니다.

“우리가 심는 모든 나무들은 기후 위기의 물결을 막는데 도움을 줄 수 있고, 기온 상승과 폭염으로 가장 큰 타격을 받는 지역사회를  더 건강하고, 더 지속 가능하게 만들 수 있습니다. 구글의 기술은 로스앤젤레스 전역의 가족과 가정에 나무의 힘을 가져다 줄 것입니다. 우리의 공공 공간에 녹지를 더하고, 도시에 아름다움을 불어넣고, 이웃들에게 더 낮은 온도를 가져다 줄 것입니다.”

– 에릭 가르세티 로스앤젤레스 시장

 

더 많은 도시를 위한 더 많은 인사이트

Tree Canopy Lab의 인사이트를 올해에는 수백 개의 더 많은 도시에서 이용할 수 있도록 할 것입니다. 로스엔젤레스와 같은 도시들이 나무 심기와 유지 보수 이니셔티브에 착수하기 위해 하고 있는 야심찬 작업을 계속 지원하겠습니다.

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.