[CARTO] 모바일 데이터 입문: 도전 과제와 모범 사례

소비자, 시민, 그리고 도시 사이의 행동 패턴과 트렌드에 대해 더 깊은 이해를 하고 싶다면, 모바일 데이터는 강력한 도구가 될 수 있습니다.

GPS 지원 가능한 스마트폰이 전세계적으로 확산되면서, 우리는 사람들이 어디를 가는지, 무엇을 하는지, 그리고 왜 전보다 이런 행동을 더 많이 하는지 좀 더 명확하게 파악할 수 있습니다. 이는 물론 개인 사생활을 보장하기 위한 더욱 엄격한 규제로 이어졌습니다. 광범위함과 명확함 때문에, 모바일 데이터는 인프라, 정책 또는 비즈니스 의사 결정을 담당하는 모든 사람들에게 귀중한 정보의 보고입니다. 하지만 많은 기관은 모바일 데이터의 유용성을 수박 겉핥기 식으로만 알고 있습니다.

 

맞춤형 Location Intelligence 애플리케이션을 구축할 때  개발자, 디자이너 데이터 과학자들이 주로 사용하는 두 종류의 모바일 데이터가 있습니다.

  • GPS 데이터: 애플리케이션은 ‘위치 서비스(Location Service)’를 켤 것인지 물어볼 때마다, 휴대폰에 구축된 ‘위성 위치 확인 시스템(Global Positioning System)’을 사용해도 되는지 물어봅니다. GPS 데이터는 지구를 공전하면서 지리 좌표를 장치로 반송하는 위성에서 추출되었기 때문에, 높은 정밀도를 자랑합니다.
  • 이동 통신사 (Telco) 데이터: 두번째 종류의 모바일 데이터는 이동 통신 회사에서 직접 가져온 데이터입니다. 제한적인 인구 통계 데이터를 가지고 있는 GPS 데이터 (앱으로 획득한 데이터만 가지고 있음)와는 대조적으로, Telco 데이터는 더 유용한 인구 통계 자료를 가지고 더 정확한 고객 프로필과 세부정보를 형성할 수 있습니다. 대신, GPS 데이터만큼 정밀하지는 않습니다.

이 두 종류의 모바일 데이터 작업에서 발생하는 주요한 문제들을 살펴봅시다.

 

 

GPS 데이터 사용 시의 문제점들

 

GPS 데이터를 안정적으로 사용하기 전, 처리해야 할 두가지 문제가 있습니다.

첫째, GPS 데이터는 아주 정밀하지만, 부정확할 때가 있습니다. 정확도와 정밀도는 지리공간적 문맥에서 동의어가 아닙니다.  정밀도란, 사람이 위치해 있는 곳을 얼마나 세밀한 측정 수치로 나타낼 수 있는지, 그리고 측정점의 위도와 경도 속성이 몇 자리수까지 GPS 데이터에 반영 되는지를 뜻합니다. 예를 들어,  어떤 사람이 뉴욕시에 있다고 하면, 그 사람이 Times Square에 있다고 말한 경우보다 정밀도가 낮습니다.

그러나 GPS 데이터는 종종 정확하지 않습니다. 고층 건물이나 지하에서 지도앱을 실행하면, 앱에서는 우리가 실제 위치한 곳에서 몇 블록 떨어져있다고 표시된 경험이 있을 것입니다. 데이터 스토리 A Millions Walks in the Park에서 배운 교훈을 토론하면서, CARTO의 연구팀은 Central Park 저수지 한 가운데의 GPS ping의 양을 언급하며 GPS 데이터가 얼마나 ‘잡음이 있고(noisy)’ 부정확할 수 있는지에 주목했습니다.

이 문제는 몇 가지 방법으로 해결될 수 있는데, 한가지 방법은 물 한복판 위에 나타나는 데이터 포인트들이나 인간이 이동할 수 없는 빠른 속도로 움직이는(“supermanning”) 포인트들을 제거하는 일반적인 방법입니다. 공간 분석을 활용한 추가적인 작업도 이루어질 수 있습니다. 또한, 공간 클러스터링과 같은 총계처리 (Aggregation) 기법들은 부정확성 문제를 해결하는 데 도움이 될 수 있습니다. GPS 신호가 20m까지 정확하다면, 신호를 그 이상의 단위로 집계하면 노이즈에 덜 민감해 집니다.

 

 

둘째, GPS 데이터는 매우 편향될 수 있습니다. 인기 증강 현실 게임 ‘포켓몬 고’의 GPS 데이터셋을 가지고 작업한다고 가정해봅시다. 이는 전 세계 유동인구를 보여주는 강력한 데이터셋일지도 모릅니다. 하지만 이 데이터는 해당 게임을 하는 사람들로 제한됩니다. 이보다 더 큰 문제점은, 이러한 애플리케이션의 인기는 시간이 지남에 따라 변한다는 것입니다.

예를 들어, 만약 특정 장소에서 애플리케이션 사용자 수가 일주일 동안 2배로 늘어난다면, 그 장소에 더 많은 사람이 있다는 것을 의미할까요? 아니면 인구 수는 같지만 그 애플리케이션을 사용하는 사람이 늘어난 것일까요? 아마 구별하기 어려울 것입니다. 비즈니스 또는 정책적 결정을 위해 GPS 데이터를 사용할 때에는, 이러한 편향성과 한계를 반드시 이해해야 합니다.

 

 

이동통신사 데이터(Telco Data)를 사용할 때 문제점

이동통신사 데이터는 GPS 데이터의 정확도와 정밀도 범위에 대해 정반대의 문제를 가지고 있습니다. 기지국에서 파생된 Telco 데이터는 매우 정확합니다. 누군가 기지국의 위치를 잡는다면, 그 기지국 내에 그 사람이 있다는 사실은 거의 확실합니다. 그러나 결함은 정밀도에 있습니다. 기지국은 전반적인 위치를 제공하며, 어떤 사람이 다수의 기지국의 위치를 찍는 다면 움직임을 보여줄 수 있습니다. 그러나 이 데이터는 정밀성이 떨어지므로  미터 단위의 정확한 위치를 알 수는 없습니다. GPS 데이터와 유사하게, 총계처리(aggregation)는 동향을 파악하고 불확실한 부분들을 제거하는 데 도움이 될 수 있습니다.

 

 

모바일 데이터의 개인정보와 보안

모바일 데이터는 여러 분야 및 산업에 걸쳐 유용성을 지닌 강력한 원천입니다. 그러나 가공되지 않은 모바일 데이터는 민감한 정보를 포함하고 있어, 데이터를 제공한 사람들의 개인정보까지 볼 수 있습니다. 이에 따라, 현지 개인정보보호 규정 (예: EU GDPR, COPPA)을 준수하면서 모바일 데이터를 사용할 방법을 찾아내는 것이 중요합니다.

책임감 있는 모바일 데이터 사용을 보장하는 일반적으로 널리 알려진 기술은 익명화(Anonymization), 그리고 총계처리(Aggregation)입니다. 데이터셋을 익명화시키는 간단한 방법은 데이터의 지리 공간적 구성요소에서 모든 장치 ID나 식별 정보를 제거하여, 개인을 특정 지점에 바인딩 하는 것을 어렵게 만드는 것입니다. 총계처리는 한 단계 더 나아가, 데이터 속 패턴과 동향을 요약적으로 표현합니다. 예를 들어, 특정 인접 지역에서 새로운 매장으로 오는 유동인구를 살펴봅시다. 총계처리 하면, “14 Mulberry Drive에 사는 Jane Smith가 일주일에 두 번 우리 가게를 방문한다.”와 같이 구체적인 내용은 밝히지 않으면서 인구 통계와 추세 정보를 제공할 수 있습니다.

 

 

모바일 데이터는 이러한 문제점에도 불구하고, 세상에서 일어나고 있는 움직임과 행동에 대해 그 어느 때보다 깊은 식견을 제공하며 의사결정자에게 전례없는 통찰력을 주고 있습니다. 그렇기 때문에 세계 모바일 데이터에 접근할 때에는 윤리적 프라이버시 표준을 준수해야합니다. 스스로 법을 준수하고, 강력한 개인정보보호 수단들을 이용하는 데이터 공급자의 데이터만을 이용해야할 것입니다. 모바일 데이터를 신중하게 사용하면, 기업과 도시가 함께 세상에서 가장 복잡한 문제를 해결할 수 있습니다.

(여기에서 원문을 확인하실 수 있습니다.)

 

 

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.