머신러닝 기반 주차 문제 예측 시스템 개발기 by Google

TECHNOLOGY

구글은 최근 머신러닝 기술을 사용하여 특정한 때와 장소에 주차문제를 예측할 수 있는 기능을 개발하여 구글 맵스 앱에 추가했습니다. 구글 개발팀은 리서치 블로그를 통해 그 과정에서 부딪힌 도전과제와 고민과 실험을 통해 도출한 해결 방안 등을 공유했는데요, 재미있는 점은 구글의 전 대표이사, 현 구글 지주회사 ‘알파벳’의 회장 에릭 슈밋(Eric Schmidt) 또한 ‘모두가 고마워 할 만한 업데이트’라며 자신의 구글 플러스 계정에 해당 블로그 글을 공유했다는 점입니다.

수 많은 구글 발행 컨텐츠 중 에릭 슈밋이 칭찬하고 ‘공유’까지 하게 만든 컨텐츠, 아래에서 바로 확인해보세요.

 


“솔로몬왕이 ‘모든 것에는 때와 장소가 있다’ 라고 말한 건 주차 문제를 겪어보지 못했기 때문이다.”

Bob Edwards, 방송 저널리스트

운전하는 시간의 대부분을 꽉 막힌 도로에서 또는 주차 공간을 찾으며 보낼 때가 있죠. 구글은 Google MapsWaze 등의 서비스로 쉽고 효율적인 운전을 돕고자 노력하고 있는데요. 아쉽지만 그동안은 사람들이 일상에서 너무도 흔하게 겪는 주차 문제를 해결할 수 있는 도구는 제공하지 못했습니다.

지난 주, 구글은 미국 25개 도시에서 목적지의 주차 문제를 예측하여 운전자가 일정을 계획하는데 도움을 주는 새로운 기능을 Google Maps for Android에 추가했습니다. 문제 파악부터 머신러닝 모델 선정까지, 구글이 이번 업데이트를 준비하면서 겪은 과정과 새로이 얻은 인사이트를 공유하고자 합니다.

구글은 먼저 아래와 같은 네 가지 큰 제약에 부딪혔습니다.

  1. 주차 공간은 시간, 요일, 날씨, 주변 행사, 공휴일 등 여러 변수에 따라 크게 달랐고 무료 주차 공간에 대한 실시간 정보를 수집할 방법이 없다는 점이 이 문제를 해결하기 더 어렵게 만들었습니다.
  2. 주차 미터기에 인터넷이 연결된 지역들도 있었지만 불법 주차, 정기 주차권 사용자, 미터기에 낸 돈을 내 놓고 일찍 떠난 경우들에 대한 데이터는 제공하지 못했습니다.
  3. 도로는 일반적으로 평면 그래프 형태에 가깝지만 교통량은 다양한 레이아웃을 따라 여러 레벨로 흐르기 때문에 주차 공간은 그 구조가 더 복잡합니다.
  4. 주차공간에 대한 수요와 공급은 계속해서 변화하기 때문에 아무리 잘 만든 시스템이라도 곧바로 현실과 동떨어진 시스템이 될 수 있다는 위험이 있습니다.

위 사항들을 고려하여 구글은 크라우드소싱과 머신러닝(machine learning)이라는 두 개념을 결합한 방법을 사용하기로 결정했습니다. 그리고 사용자들에게 목적지에 도착했을때 맞닥뜨릴 수 있는 주차 문제를 알려주어 이동 수단을 결정하는데 도움이 될 수 있는 시스템을 만들었습니다. 그 결과, 론칭 전 테스트에서 길찾기 기능에서 대중교통 버튼에 대한 클릭 수가 크게 증가한 것을 확인했습니다. 목적지의 주차 정보를 아는 사용자들이 운전 대신 대중교통을 고려할 가능성이 높다는 것을 의미하는 것이죠.

주차문제 정보를 제공하는 기능의 기반이되는 알고리즘을 만들기 위해 세 가지 기술적 요건을 세웠습니다. 1) 크라우드소싱으로 수집한 정확한 데이터 2) 적합한 머신러닝 모델 3) 모델 학습에 사용할 알맞은 피쳐(feature)

(1) Ground Truth Data

정확한 데이터 수집은 머신러닝 솔루션을 만드는데 중대한 어려움이 되곤 합니다. 구글은 우선 다양한 장소와 시간에 사용자들에게 주차 공간을 찾는데 어려움이 있었는지 물어봤습니다. 하지만 같은 시간과 장소에서도 개인에 따라 주차가 “쉽다”고 대답할 수도, “어렵다”고 대답할 수도 있기 때문에 수집되는 데이터의 객관성이 떨어진다고 판단했습니다. 그래서 “주차를 하는데 시간이 얼마나 걸렸나요?”와 같은 객관적인 질문으로 질문을 변경해 수집되는 데이터에 대한 신뢰도를 높였고 10만 개가 넘는 양질의 데이터를 크라우드소싱할 수 있었습니다.

(2) Model Features

다음 단계는 수집된 데이터로 머신러닝 모델을 학습시킬 수 있는 피쳐를 선택하는 것이었습니다. “집단지성효과”를 위해 자신의 위치 정보를 제공하겠다고 설정한 Google Maps 사용자들에게서 수집되는 익명의 위치 데이터를 활용키로 했습니다. 이 데이터는 구글이 실시간 교통상황특정 장소에 사람들이 붐비는 시간, 방문자들이 해당 장소에서 보내는 시간 등 유용한 정보를 제공할 수 있도록 하는 중요한 데이터입니다.

하지만 이 데이터만으로는 몇몇 문제를 해결하지 못한다는 점도 금방 알게 되었습니다. 예를 들어, 누군가가 외부인은 주차할 수 없는 아파트 단지 내 주차했는데 시스템이 이 정보로 해당 장소의 주차 환경이 좋다고 판단하면 안되겠지요. 택시를 타고 어느 장소에 도착한 사용자들이 있으면 시스템이 해당 장소의 입구 앞에 주차공간이 많다고 판단 할 수도 있고 대중교통 이용자들은 마치 버스 정류장에 주차를 한 것처럼 보일 수 있습니다. 이와 같은 가긍정적 판단(false positives)은 머신러닝 시스템이 잘못된 판단을 하는데 원인이 될 수 있습니다.

때문에 알맞은 aggregate 피쳐가 필요했습니다. 이에 대한 실마리는 생각보다 가까운 곳에서 발견할 수 있었는데요. 아래는 구글 본사가 있는 캘리포니아 마운틴뷰(Mountain View)의 다운타운 지도 입니다. 만약 다수의 구글 내비게이션 사용자들이 이처럼 어느 지점을 계속해서 도는 모습을 보인다는 것은 주차 공간을 찾는것이 매우 어려울 확률이 높다는 말이 될 수 있습니다.

구글 팀은 다음으로 ‘주차가 어려운 상황’을 감지하기위한 특이 지표를 선택해야 했습니다. 목적지 ‘바로 앞’까지 운전하는 예상 소요시간과 실제 사용자가 목적지 근처에 도착해 주차 공간을 찾기위해 주변을 돌고 마침내 주차를 한 뒤 목적지로 걸어가 도착한 실제 시간 간의 차이를 선택했습니다. 만약에 다수의 사용자들이 이 두 시점에 큰 차이를 보이면 시스템이 주차가 어렵다고 판단하는데 긍정적인 지표로 사용하도록 했습니다.

이를 시작으로 주차 장소의 분포, 시간 및 요일에 따른 주차의 용이성 (예를들어 특정 목적지에 대해, 아침에는 사용자들이 가까운 곳에서 주차 장소를 찾고 교통량이 많은 오후에는 멀리 주차를 하는 경우), 과거 주차 데이터 등을 고려한 다른 20가지 피쳐들을 정의했습니다.  

(3) Model Selection & Training

모델의 퍼포먼스를 향상시키는 것이 다음 과제였습니다.구글은 몇 가지 이유로 로지스틱 회귀(logistic regression) 모델을 사용하기로 결정했는데요.  먼저 로지스틱 회귀 모델의 분석 패턴이 잘 알려져 있고 훈련 데이터의 노이즈에도 탄력적으로 대응할 수 있기 때문입니다. 구글이 크라우드소싱한 데이터는 ‘주차 자리를 찾는 것이 얼마나 어려웠나요?’와 같은 질문에 대한 응답이었기 때문에 수집 데이터가 비교적 복잡했습니다.  이런 경우 모델의 탄력성이 큰 도움이 됩니다. 두번째로, 이와 같은 모델의 수행 결과를 주차의 어려움을 확률 퍼센티지로 나타내고 “제한적 주차 환경,” “쉬움” 등 질적 묘사와 맵핑 하는 것이 합리적이라고 판단했기 때문입니다. 세번째로는 머신러닝 모델의 훈련 과정을 시작했을 때 앞서 정한 특이 지표 피쳐가 이 시스템의 핵심 열쇠가 되리라 생각했기 때문입니다. 하지만 놀랍게도 이는 완전히 틀린 가정이었습니다. 실제로는 주차 장소의 분포가 주차의 어려움을 예측하는데 가장 효과적인 요소였습니다.

Results

구글은 이렇게 특정 때와 장소의 주차 문제를 추측할 수 있는 시스템을 개발했습니다. 아래 그림은 이 시스템의 산출물 예시인데요. 이와 같은 산출물을 바탕으로 도착지의 주차 문제를 추측한 정보를 제공해 줄 수 있습니다. 예를들어 월요일 아침에는 도시 전역에서, 특히 가장 사람이 붐비는 금융 및 쇼핑 지역에서 주차 문제가 많이 발생합니다. 반면 토요일 저녁에 주차가 어려운 지역은 주로 레스토랑이 몰려있는 곳이거나 관광지입니다.

 
샌프란시스코 금융 지역 및 유니언 스퀘어에 주차 문제 판단 모델을 사용한 산출물. 붉은 지역은 주차가 어렵다는 명제의 신뢰도가 높은 곳. 상단 오른쪽부터 시계방향: 1) 월요일 아침 8시 2)월요일 저녁 9시 3) 토요일 저녁 9시 4) 토요일 아침 8시

구글은 사용자 피드백을 통해 계속해서 이 모델을 발전시켜나가고자 합니다. 구글이 주차의 불편함에 대해 더욱 잘 이해할 수록 더 새롭고 스마트한 방식으로 사용자들의 이동을 도울 수 있으리라 생각합니다.


SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.