[한국경제] ‘현지인 추천 여행지’ 한눈에…통계청·SKT 지도 서비스 시작

모바일 빅데이터 기반 유동인구 지도 고도화 서비스

여행자와 현지인이 추천하는 여행지와 서울시 주요 상권 인구 분포 등의 정보를 한눈에 확인할 수 있는 지도 서비스가 생겼다.
통계청은 5일 SK텔레콤과 함께 모바일 빅데이터를 기반으로 한 유동인구 지도 고도화 서비스를 시작한다고 밝혔다.
이번 서비스를 통해 제공되는 지도는 시군구별 인구 유출입 현황, 지역별 실거주인구와 주민등록인구 등 기본 인구 현황을 시각화해 보여준다.여행자·현지인 대상 조사를 토대로 한 지역별 여행 특성, 서울 주요 상권의 성·연령별 인구분포, 서울 근로자 성·연령별 인구분포 등 테마 지도도 함께 제공된다.
지도를 보려면 통계데이터센터 홈페이지(http://data.kostat.go.kr)의 ‘빅데이터 활용’ 페이지에서 ‘모바일 유동인구 지도’를 찾으면 된다.
통계청은 “SK텔레콤과 함께 앞으로 지도 서비스 내용을 확대하고 공공 데이터와 민간 모바일 빅데이터 연계로 다양한 통계를 생산·제공하기 위해 노력할 것”이라고 밝혔다.

신문기사 출처: https://www.hankyung.com/economy/article/202011056625Y

유입인구: 타 지역에서 해당지역으로 이동한 인구량을 나타낸 지도

통신모바일 빅데이터로 본 유동인구 지도서비스를 이용할 수 있는 매뉴얼도 추가하여 드립니다 ** 

CARTO를 기반으로 만든 유동인구 지도 고도화 서비스 입니다. 모바일 빅데이터를 활용한 서비스인 데 시각적으로 잘 표현될 수 있도록 CARTO VL을 활용하였습니다. CARTO VL을 이용해 CARTO DB에 있는 데이터들을 불러와서 레이어로 시각화하는 작업을 하였습니다. 데이터 불러오기와 동시에 CARTO css로 style을 지정해서 데이터 시각화 디자인을 손쉽게 할 수 있었던 점이 좋았습니다. CARTO css에서 제공하는 ramp 등으로 각 값들의 단계를 나눠 값들의 정도로 색상을 나타내기도 매우 간단하였습니다.

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.

플릿 매니지먼트(fleet management)란 무엇인가요?

플릿 매니지먼트는 물류 업계에서 점점 더 중요해지고 있고, 그 가치를 인정받고 있습니다. 특히 요즘과 같은 시대에는 생활 필수품과 서비스에 대한 액세스를 보장하는 것이 매우 중요합니다. 다른 산업들이 COVID-19의 대유행으로 부정적인 영향을 받은 반면, 플릿 매니지먼트 시장은 2020년 199억 달러에서 2025년 340억 달러로 성장할 것으로 예상됩니다.

 

플릿 매니지먼트란 무엇인가요?

National Private Truck Council의 연간 벤치마킹 조사에 따르면 미국에서 200,000개 이상의 회사가 사내 플릿을 운영하고 있습니다.

이러한 플릿은 상용 자동차(자동차, 밴, 트럭), 지게차, 트레일러, 작업 목적으로 사용되는 개인 차량, 항공기(비행기와 헬리콥터), 선박, 철도 차량 및  발전기, 탱크, 기어 박스, 덤프터, 컨테이너, 트레일러, 굴삭기 등 비동력 자산까지 포함합니다.

 

미국에서 가장 큰 기업 플릿은 AT&T가 운영하고 있습니다. AT&T는 60,000대 이상의 차량을 관리하고 있으며, CPG/FMCG 거대 기업인 PepsiCo가 51,000대로 그 뒤를 따라잡고 있습니다. 이런 큰 규모의 플릿을 구성하고 관리하는 데는 다음과 같은 작업이 필요합니다:

  • 차량 리스 및 파이낸싱
  • 차량 텔레매틱스(추적 및 진단)
  • 차량 유지 보수
  • 공급망 관리
  • 연료 소비 및 비용 감독
  • 드라이버 관리
  • 자산 활용
  • 경로 계획
  • 보안 및 규정 준수 보장

 

플릿 관리 프로세스에서 로케이션 인텔리전스를 활용하면 기업은 효율성을 개선하고, 비용을 절감하는 동시에 정부 규정까지 준수할 수 있습니다. 플릿 자산을 시각화하고 트래픽, 날씨 및 경로 데이터와 같은 데이터 스트림을 잘 활용하면 조직에 두 자릿수의 비용 절감을 가져올 수도 있습니다.

 

 

차량 텔레매틱스 (추적 및 진단)

*텔레매틱스: 자동차와 무선통신을 결합한 새로운 개념의 차량 무선인터넷 서비스

플릿 매니지먼트의 주요 요소는 바로 텔레매틱스입니다. GPS가 지원하는 차량 텔레매틱스 하드웨어의 효과적인 사용은 플릿 관리자가 차량 보호를 위해 차량을 추적하고, 관련 담당자에게 물품 이동에 대한 정확한 정보를 전달하고, 운전자 및 차량 상태를 모니터링 하는 데 도움이 될 수 있습니다.

예를 들어, 여러 유통 회사를 거쳐 냉장・냉동 유통을 하는 식료품점 체인은 텔레매틱스 하드웨어가 장착된 차량으로부터 수신된 데이터를 분석하고 시각화함으로써 온도에 민감한 물품을 효과적이고 안전하게 배달할 수 있습니다.

또 다른 예시로는 아래 이미지의 Urbo가 있습니다. Urbo는 Telefonica가 공공 부문 고객을 위해 CARTO 플랫폼을 활용하여 개발한 스마트시티 솔루션입니다. 이를 통해 텔레매틱스 하드웨어에서 제공하는 추가 정보와 함께 다양한 유형의 차량(대중교통, 우편, 경찰 및 폐기물 차량)의 실시간 위치를 모니터링 할 수 있습니다.

 

 

 

 

연료 소비 및 비용 감독

차량 구입, 리스 비용과 함께 연료 비용은 플릿 관리 예산의 상당 부분을 차지합니다. 앞서 언급한 바와 같이 트래픽, 날씨 및 경로 데이터와 같은 데이터 스트림을 사용하여 플릿 활동을 최적화하면 상당한 비용 절감을 달성할 수 있습니다. 최근 what3words와의 웨비나에서, CARTO는 해결 솔루션을 제공하기 위해 라스트마일 물류 회사(예: DPD)와 협력하여 효율성을 15% 향상할 수 있는 방법에 대해 논의했습니다.

드라이버의 행동(속도 및 공회전 시간 단축)에 영향을 미치는 텔레매틱 하드웨어의 기능 뿐 아니라, 경로 및 네트워크 최적화도 연료 비용을 절감하는 데 큰 역할을 합니다.

예를 들어 SEUR은 냉동 운송 네트워크를 최적화하여 주문 당 평균 거리인 18.99km를 18.23km로 줄일 수 있는 솔루션을 구축했습니다. 매년 SEUR이 냉동 운송으로만 수십만 건의 주문을 배달하는 것을 고려하면, 이는 매우 큰 절감으로 이어질 수 있습니다. 주문이 50만개라고 하면 38만km의 주행 거리를 줄임으로써 연료 및 비행대 규모 면에서 상당한 절감 효과를 가져올 것입니다. Python 패키지인 CARTO프레임을 사용하여 만든 아래 애니메이션은 물류 센터의 개폐가 미치는 영향과 이것이 운영 비용에 미치는 영향을 보여줍니다.

 

 

 

보안 & 규정 준수

자산을 보호하기 위해 지오펜싱은 차량이 특정 위치 주변에 미리 정제된 가상 경계를 벗어나지 않도록 하는 효과적인 방법이 될 수 있습니다. 지리공간 플랫폼은 이러한 지오펜스로 구성할 수 있으므로, 플릿 관리자 또는 회사 내의 다른 관리자가 차량이 경계에 진입하거나 나갈 때 경고를 받을 수 있습니다. 이 작업은 “영향 영역” 또는 “등치선”을 생성하거나 아래 표시된 것과 같은 대화형 그리기 도구를 사용하여 수행할 수 있습니다. 여기서 비즈니스 확장 시 수정될 수 있습니다.
마지막으로, 본 게시물에 설명된 위치 데이터를 저장하고 분석할 수 있는 기술과 플랫폼을 사용하면 플릿 관리자가 지역 및 국가 규정을 준수하는 데에도 도움이 될 수 있습니다.

예를 들어 미국에서 전자 기록 장치(ELD) 의무는 2017년 12월부터 시행된 의회 의무사항으로 상용 차량 운영자는 서비스 시간(HOS)을 전자적으로 기록해야 합니다. 영국에서는, 2008년 4월에, 기업 과실치사법이 강화되어, 사업상 사용되는 차량과 관련된 도로 사망의 경우, 운전자뿐 아니라 회사 경영진까지 처벌을 받습니다. 두 경우 모두 위치 데이터를 저장하고 처리할 수 있는 강력한 솔루션을 확보하는 것이 중요합니다.

위에서 설명한 사례들은 플릿 관리에서 공간 데이터를 사용하는 방법에 대한 몇 가지 예와 모범 사례에 불과합니다. 플릿 관리자의 역할이 발전함에 따라 IoT 및 데이터 분석은 이제 업무에 필수적인 요소이며, 데이터 생성의 본질적인 부분이 위치이므로 공간적인 측면에서 플릿 운영을 간소화할 수 있습니다.

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.

[CARTO] 이달의 지도 : 커피 공급망 추적 시스템

어떤 사람들은 커피를 상품으로 볼 수도 있겠지만, 어떤 사람들은 커피의 다양성과 커피를 독특하게 만드는 속성에 집중합니다. 커피의 원천을 “추적”하는 것은 커피가 어디에서 재배되고 가공되는지를 찾는 것뿐 아니라, 그 장소의 사회적, 환경적, 경제적 조건까지 이해하는 것입니다. “커피가 어디서 왔는가”나 “누가 이 커피를 여기 들여오기 위해 무슨 일을 했는가”하는 질문에 대답하는 것 그 이상의 의미를 가집니다. 완전한 추적 시스템은 커피 생산지에서 무슨 일이 일어나고 있고 그 이야기의 어떤 부분이 현재 커피의 상태에 영향을 끼치는 것까지 아는 것을 의미합니다.

 

소개 & 상황 설명

지난 포스팅에서 우리가 매일 마시는 커피 한 잔에 약 1250만 명의 소규모 커피 농부가 관여되어 있다는 사실을 보여드렸습니다. 그 중 44%가 국제 빈곤선 아래에 있으며, 이 빈곤을 이해하려면 커피 공급망이 매우 길고 복잡하다는 것을 알아야 합니다. 이는 특히 우리가 마시는 커피가 단일 농장에서 나오는 것이 아니라 대부분 여러 농장에서 오는 것이며, 심지어는 여러 지역, 국가에서 오는 것이기 때문입니다. 이 포스팅을 읽으면서 소비자와 소규모 농부 모두를 위해 추적 시스템이 꼭 필요함을 알게 되셨으면 좋겠습니다.

 

퀄리티와 맛의 정보를 이해하기 위해 추적 시스템 사용하기

특정 지역과 품종은 독특한 특성으로 유명합니다. 에티오피아를 예로 들어 보겠습니다. 커피를 좋아하는 분들이라면 “예가체프(Yirgacheffe, 이르가체페)” 커피를 들어보셨을 겁니다. 와인처럼 커피의 풍미 프로필 역시 어떤 종류의 커피를 재배할 것인지, 나무에서 커피를 딴 다음 어떻게 가공할 것인지와 같은 농부의 선택 뿐 아니라 토양, 기후, 고도와 같은 자연적 특성에도 영향을 받습니다.

“예가체프”라는 이름은 사실 에티오피아의 마을 이름입니다. “예가체프”라는 이름으로 거래되는 대부분의 커피는 더 넓은 권역에서 오는 것입니다. 지난 10년 간 에티오피아는 커피의 원산지, 맛 등의 특성에 따라 커피를 분류하는 내부 시스템을 변경했습니다. 분류 체계는 복잡하며, 행정적인 구역도 변경되었습니다. 내부 거래 플랫폼 – 에티오피아 상품 거래소 – 은 전국에서 오는 유사한 커피의 집적 및 입고 관리를 위해 설립되었습니다. 이러한 서로 다른 시스템은 “예가체프”라는 이름 외의 커피를 추적하기 어렵게 만들고 있습니다.

 

 

 

추적 시스템 정의 및 평가하기

위에서 에티오피아의 예시를 통해 커피와 커피 산지를 연관짓는 데 지리적 추적 시스템이 어떤 역할을 하는지 설명했습니다.

그러나 공급망을 추적할 수 있다고 해서 그 공급망이 윤리적이라고 단정지을 수는 없습니다. 추적 시스템이 우리 소비자들에게 중요하다면, 공급망의 지속 가능성이나 윤리에 대해서도 그만큼의 가치를 부여하길 바랍니다. 커피 원두는 우리의 머그잔에 도달하기까지 많은 손을 거칩니다. 농부가 생산하는 모든 커피가 동일한 보관 체인을 거친다고 가정할 수 있는 경우는 거의 없습니다.

이 지도는 대부분의 커피 농부가 조직화되어 있지 않다는 것을 보여줍니다. 대신 농부들은 다양한 커피 수집가들에게 판매합니다. 물리적으로 농부 단체나 협동 조합으로 커피를 추적할 수 있다 하더라도, 이러한 구매자들은 추적가능성을 유지하기 위해 회원 지원 시스템을 유지하고 비회원 커피를 물리적으로 분리해야 합니다.

 

 

물리적인 추적 가능성은 커피 구매자들의 한 가지 방안이지, 유일한 방안이 될 수는 없습니다. 지속 가능성 문제에 대한 이러한 문제를 강조하고 해결하기 위해 인센티브를 제공하는 등 시스템을 통해 이를 보완할 필요가 있습니다.

이 문제는 실제로 일어나고 있는 일이며, 관심을 필요로 합니다. 500만 명이 넘는 커피 농부들이 가난에 허덕이고 있으며 지속 가능한 커피를 생산하는 것이 그들의 책임만이 될 수는 없습니다. 이 과정에서 우리는 농부들을 지원하여 그들이 직면하고 있는 문제와 절충점을 이해해야 합니다. 위에서 예로 든 이르가체프의 농장은 매우 작고, 나무들은 늙고 있으며 생산성도 일정하지 않습니다. 농부와 구매자 모두 이러한 문제들이 나아지길 바랍니다.

이러한 정보는 기술과 현장의 힘을 합쳐 수집할 수 있으며, 무엇보다도 이러한 문제점을 전혀 고려하지 않는 현 시스템에 도전함으로써 수집할 수 있습니다. 커피 산업의 문제점에 대한 신뢰도 있는 데이터와 이 데이터를 소비자들에게 전달하는 방식에 대해 더 높은 기준을 유지할 필요가 있습니다. 우리가 마시는 커피의 원산지가 다양해진다고 해서 그 곳의 농부들이 부유해지는 것이 아니라는 걸 알아야 합니다.

 

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.

CARTO & 구글 클라우드 파트너십 발표

15년 전 구글 지도가 출시된 이후, 구글은 로케이션의 선두주자가 되었습니다. 오늘날 10억 명이 넘는 사람들이 매달 구글 지도 서비스를 이용하고 있으며, 모든 산업에서 방대한 양의 위치 데이터가 생성됨에 따라 보조를 맞출 수 있는 지리공간 기술에 대한 요구가 증가하고 있습니다.

CARTO는 구글 클라우드와의 더욱 긴밀한 협업을 위해 구글 클라우드와 파트너십을 체결했습니다.

이를 통해 Data Observatory 2.0을 구축하여 구글 클라우드와 BigQuery의 놀라운 기반과 기능을 활용하고, 구글 BigQuery에 저장된 데이터를 CARTO 계정에 연결하여 간단한 SQL 조회로 다양한 사용 사례를 확인할 수 있는 BigQuery 커넥터를 릴리스합니다.

또한 이 전략적 파트너십을 통해 세계 최고의 위치 인텔리전스 플랫폼이 구글 클라우드 플랫폼 마켓플레이스(GCP)에 제공됨으로써 차세대 공간 데이터 인프라를 고객에게 제공할 수 있는 비전을 더욱 확고히 할 수 있게 되었습니다.

 

 

왜 CARTO와 구글 클라우드 마켓플레이스를 선택해야 하나요?

 

CARTO는 인프라를 관리하는 완전한 SaaS 솔루션과 고객이 인프라를 관리하는 온프레미스 솔루션의 두 가지 버전으로 제공되어 왔습니다. Google 클라우드에서 구현하고자 하는 사용자의 편의를 도모하기 위해, GCP 마켓플레이스에서 플랫폼이 솔루션으로 활용되고 있습니다. CARTO의 목표는 사용자가 몇 분 안에 자신의 CARTO 인스턴스를 스핀할 수 있도록 하는 것입니다.

GCP 마켓플레이스에서 CARTO를 솔루션으로 제공하기 위해 많은 노력을 기울여 왔습니다. 이제 몇 번의 클릭만으로 VM(가상 머신)에서 전체 스택을 스핀할 수 있습니다. 이를 통해 Google Cloud 및 CARTO 유저는 Google Cloud Platform에서 제공하는 최첨단 클라우드 컴퓨팅 서비스와 함께 가장 강력한 다목적 지리공간 엔진을 구현할 수 있습니다.

오늘날의 데이터 집약적인 사용 사례에는 데이터 소스와 분석 툴 간의 원활한 통합이 필요합니다. CARTO는 BigQuery에서 데이터를 원활하게 가져올 수 있으므로 데이터 과학자가 지리공간 데이터를 빠르고 효율적으로 분석할 수 있습니다.

” CARTO를 구글 클라우드 플랫폼 마켓플레이스에 출시하게 되어 아주 기쁩니다. 저희는 리테일, CPG, 통신, 헬스케어 등 다양한 산업의 고객을 보유하고 있습니다. 이번 파트너십이 기업들의 공간 분석에 대한 더 많은 관심을 모을 것으로 예상합니다. ”

Javier de la Torre, CARTO 설립자 및 CSO

 

 

 

성능

구글 클라우드는 2코어~416코어와 2GB~5.8TB의 램에 이르는 다양한 가상 인스턴스를 제공합니다. 미세한 조정이 없다면 이런 수직적 확장에서 가치를 끌어내기 어려울 수 있습니다. CARTO는 사용자가 이 문제에 대해 걱정할 필요가 없도록 하기 위해 노력했으며, GCP 솔루션에 CARTO의 구축 기술을 도입하여 사용하는 모든 새로운 vCPU에 대한 완벽한 가치를 제공합니다.

예를 들어 코어 수가 8개인 e2-standard-8 인스턴스는 코어 수가 4개인 n1-standard-4 인스턴스를 사용할 때보다 초당 타일 양이 거의 두 배 증가합니다. 따라서 컴퓨팅 및 메모리 요구 사항에 따라 가장 적절한 인스턴스를 사용할 수 있습니다. 다음 그래프에서는 다양한 환경에서 실행되는 CARTO의 벤치마크를 볼 수 있습니다.

GCP의 작동 방식 덕분에 언제나 인스턴스를 중지하고, 크기를 조정하고 재시작하여 CARTO에서 사용할 수 있는 리소스를 늘릴 수 있습니다.

 

 

3분 안에 준비됩니다

초기 배포 양식을 몇 가지 기본 구성으로 채우는 것이 중요합니다. 3분 만에 프로덕션 지원 인스턴스를 구축할 수 있습니다!

 

배포 옵션

CARTO는 GCP에서 두 가지 버전으로 제공됩니다:

  • BYOL(carto-enterprise-byol): 인스턴스가 만들어지지만 유효한 구독이 활성화될 때까지 CARTO 스택이 작동하지 않습니다. sales@carto.com로 CARTO 팀에 문의하여 목적에 맞는 연간 구독 옵션을 시작하시기 바랍니다.
  • 사용량만큼 지불(carto-enterprise-payg): 즉시 가동되어 실행되며 RAM 및 vCPU의 GB에 따라 분당 사용료를 지불합니다. CARTO에서 코드를 받을 필요가 없으며 비용은 GCP 요금에 포함되어 있습니다.

 

차세대 공간 데이터 인프라를 위해

구글 클라우드는 현존하는 가장 정교한 분석 툴을 제공하며, 기존 고객과 파트너를 통해 이러한 툴이 매우 유용하다는 것을 알고 있었습니다. 확장성, 경제성, 보안 및 편의성에 중점을 둔 BigQuery와 CARTO와 같은 제품은 미래의 공간 데이터 인프라 아키텍처를 재고할 수 있는 기회를 제공합니다.

이 파트너십은 제품 통합에 대한 더 많은 발표를 위한 시작에 불과합니다. CARTO는 여러분이 이 제품을 통해 어떤 성과를 거둘지 기대하고 있으며, 앞으로도 사용자들의 편의를 위한 여러 통합을 제공하겠습니다.

 

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.

구글 빅쿼리 시각화: 대용량 공간 데이터 매핑

Google BigQuery Visualization: Mapping Big Spatial Data

구글 직소(Jigsaw)가 지원하는 GDELT 프로젝트는 100개 이상의 언어로 전 세계 거의 모든 국가의 방송, 인쇄 및 웹 뉴스를 모니터링하고, 매일 매초마다 사람, 위치, 조직, 테마, 감정, 카운트, 수, 인용, 이미지, 이벤트 등을 식별하는 무료 오픈 플랫폼입니다.

 

GDELT 프로젝트 시각화는 가장 자주 언급되는 25,000명의 화제의 인물과 그들 사이의 관계를 보여줍니다

 

최근 GDELT GEO 2.0 API를 지원하는 기본 데이터셋인 GDELT Global Geographic Graph가 출시되었습니다. 2017년 4월 4일부터의 전 세계 영어 온라인 뉴스보도에서 17억 개 이상의 위치 언급에 대한 내용을 포함하고 있습니다. 각 언급의 맥락과 용도에 대한 600자 문맥에 관한 토막글도 제공하여 상세한 내용을 담고 있습니다.

 

GDELT 프로젝트는 공개 연구를 위한 전 세계 인간 사회의 실시간 네트워크 다이어그램 및 데이터베이스입니다

 

GDELT가 작성한 이 게시물은 구글 빅쿼리와의 통합이 어떻게 이 거대한 데이터 세트를 매핑하는 데 활용될 수 있는지에 대해 조사합니다. 이 게시물은 전염병이 유행하는 동안 서로 다른 지역의 COVID-19 뉴스 취재에 초점을 맞춥니다.

Global Geography Graph는 2017년까지 전세계 영어 뉴스 보도에서 17억 개 이상의 위치 언급 정보를 보유하고 있으며, 이로 인해 세계 뉴스의 지리 지도를 만들 수 있게 되었습니다.

Global Geographic Graph에서 맵을 생성하는 작업에는 전통적으로 BigQuery SQL 쿼리를 실행하여 결과를 컴파일하고 CSV 파일로 다운로드한 다음 CARTO로 해당 파일을 가져와 실제 맵을 생성하는 작업이 포함되었습니다. 그러나 CARTO에는 실제로 BigQuery 커넥터가 내장되어 있으므로 CARTO에 SQL 쿼리를 직접 붙여넣기만 하면 됩니다. CARTO는 BigQuery에서 쿼리를 실행하고 결과를 지도에 완벽하게 다운로드하며 고정된 내부에서도 쿼리를 다시 실행하여 지도를 지속적으로 동기화할 수 있습니다!

5월 한 달 동안 COVID-19와 관련된 영어 뉴스 보도에서 언급된 위치 지도를 만들고 싶다고 가정해 보겠습니다. CARTO 계정에 로그인한 후 “New Dataset”을 선택하고 데이터소스로 “BigQuery”를 클릭한 다음 “Connect” 버튼을 클릭합니다. 그럼 아래와 같은 대화 상자가 표시됩니다:

 

“Billing Project ID” 드롭다운에는 구글 클라우드 프로젝트 목록이 자동으로 표시됩니다(BigQuery의 쿼리가 청구될 할당량에 대한 프로젝트). 그런 다음 SQL 조회 상자에 쿼리를 붙여넣고 새 CARTO 데이더셋의 이름을 선택한 다음 “Connect to BG”를 클릭합니다. 그럼 이게 끝입니다! 여기까지 완료하면 CARTO가 BigQuery로 쿼리를 보내어 실행할 수 있도록 하고, 몇 분 안에 결과가 다시 CARTO로 스트리밍되어 새 데이터셋을 채우게 됩니다.

실행할 실제 쿼리는 다음과 같습니다(국가 레벨 일치를 위해 “GeoType > 1” 사용).

SELECT ST_GeogPoint(Lon, Lat) as the_geom, count(1) Cnt FROM `gdelt-bq.gdeltv2.ggg` where (ContextualText like ‘%COVID%’ and ContextualText like ‘%coronavirus%’)and GeoType>1 and DATE(DateTime) >= “2020-05-01” AND DATE(DateTime) <= “2020-05-31” group by Lat,Lon order by Cnt desc limit 10000

쿼리의 시작 부분에 있는 “ST_GeogPoint(Lon, Lat) as the_Geom”은 위도 및 경도 좌표를 취하여 지리 “점” 유형으로 변환합니다.

또는 Global Geography Graph에 “the_gem”이라는 GERIORY 열이 이미 있으므로 다음을 사용할 수도 있습니다.

 

SELECT ANY_VALUE(the_geom) as the_geom, count(1) Cnt FROM `gdelt-bq.gdeltv2.ggg` where (ContextualText like ‘%COVID%’ and ContextualText like ‘%coronavirus%’) and GeoType>1 and DATE(DateTime) >= “2020-05-01” AND DATE(DateTime) <= “2020-05-31” group by TO_JSON_STRING(the_geom) order by Cnt desc limit 10000

여기서와 같이 지리 열을 기준으로 그룹화하는 것은 대부분의 관찰/표본된 지리 데이터의 부정확한 특성 때문에 매우 나쁜 관행이라는 점을 기억해야 합니다. GPS 지점을 수집할 때, 정지된 물체는 GPS 지터(jitter)로 인해 실제 위치 주변의 작은 반지름에서 계속 움직이는 것처럼 보일 수 있으며, 표본 추출의 부정확성과 오류는 서로 약간 다른 점들의 군집을 산출할 수 있습니다.

그리드에 스냅하는 것만으로는 그리드 해상도에 관계없이 점 군집이 원형 좌표로 분할되기 때문에 이 문제가 해결되지 않습니다. Global Geography Graph의 경우, 모든 위치는 중심 기반 지명 사전에서 추출됩니다. 프랑스 파리에 대한 모든 참조는 항상 정확하게 동일한 좌표를 산출합니다. 따라서 여기서는 좌표를 기준으로 안전하게 그룹화할 수 있습니다. 그러나 다른 종류의 데이터는 이에 대해 강력하게 반대합니다. 이러한 종류의 “상위 N” 그룹을 수행하기 위해 관측된 GIS를 사용할 경우 먼저 점을 군집화해야 합니다.

몇 분 안에 데이터가 표준 CARTO 테이블로 표시되고 데이터를 즉시 매핑할 수 있습니다.

그러나 각 위치를 언급하는 상위 5개 기사를 표시하는 대화형 클릭 가능한 지도를 만들려면 어떻게 해야 할까요?

아래 쿼리는 위치별로 상위 5개 기사를 선택하여 제목과 URL을 HTML 블록에 연결하고 해당 소셜 미디어 이미지 중 하나를 헤더 이미지로 선택합니다.

select ST_GeogPoint(Lon, Lat) as the_geom, ARRAY_TO_STRING(ARRAY_AGG(Art ORDER BY cnt DESC LIMIT 5), ‘<BR><BR>’) Articles, max(SharingImage) SharingImage, APPROX_TOP_COUNT(Loc, 1)[OFFSET(0)].value LocationName, Count(1) NumMentions from (

select CONCAT(‘<a href=”‘, min(URL), ‘” target=”blank”>’,max(Title),'</a>’) Art, Lat, Lon, max(SharingImage) SharingImage, APPROX_TOP_COUNT(Location, 1)[OFFSET(0)].value Loc, count(1) cnt FROM `gdelt-bq.gdeltv2.ggg` WHERE (ContextualText like ‘%COVID%’ and ContextualText like ‘%coronavirus%’) and GeoType>1 and DATE(DateTime) >= “2020-05-01” AND DATE(DateTime) <= “2020-05-31” group by LOWER(Title), Lat, Lon

) group by Lat, Lon order by NumMentions desc limit 10000

 

다시 한 번 데이터를 CARTO 데이터셋으로 가져옵니다. 4월에 사용한 것과 동일한 지침에 따르면 (그러나 이번에는 데이터를 CSV로 저장하고 CARTO에 다시 로드하는 부분을 건너뜁니다. 이제 그럴 필요가 없으니까요!) 아래와 같은 대화형 지도를 얻을 수 있습니다.

커넥터에서 입증되었듯이 데이터를 연결하고 CARTO 플랫폼에서 사용할 수 있도록 하려면 BigQuery에서 SQL 조회만 입력하면 됩니다. 이를 통해 쉽게 시각화, 공간 분석 및 빌드 애플리케이션을 수행할 수 있습니다.

 

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.

소매업 분석: SNS & 신용카드 데이터 결합

 

COVID-19의 영향이 모든 산업, 특히 소매업에서 계속해서 나타나고 있습니다. 기록적인 판매 하락이 이어지고 있는 지역도 있는 반면, 회복될 조짐을 보이는 지역도 있습니다.

예를 들어 싱가포르의 5월 총 소매 판매는 52.1%나 감소한 반면, 유럽의 가장 큰 경제국인 독일은 규제 완화 이후 13.9%의 기록적인 증가를 보였습니다. 앞서 말한 바와 같이, 이러한 차이점들은 바이러스 확산의 불균형때문에 나타난 것일 수 있습니다. 그럼에도 불구하고 소매업체가 생존하고 발빠르게 대응하기 위해서는 기술에 투자하고 소비자 데이터를 탐구해야하는 것만은 분명합니다.

 

 

 

최근 Spatial.ai의 지리사회적 데이터와의 통합으로, 이제 고객들은 다양한 행동 데이터재무, 유동인구 및 인구 통계와 같은 다양한 범주의 데이터 간의 관계와 패턴을 탐색하여, 위치에 대한 새로운 통찰력을 제시할 수 있게 되었습니다. 본 사례 연구에서는 신용카드 거래 데이터와 지리사회적 데이터가 어떻게 상호작용하는지를 연구하여 SNS와 레스토랑 매출과의 관계를 파악했습니다. 소매업체가 지역에 따라 설치 공간을 최적화하는 데 도움이 될 수 있는 시장 차이를 조명합니다.

SNS가 사람들이 감정, 의견, 관심을 세계에 표현하는 장이 되면서, 이는 사람들이 특정 장소에 있을 때 어떻게 행동하는지를 보여주는 귀중한 정보 원천이 되었습니다. Spatial.ai는 포스팅, 트윗, 스토리 등에서 나온 방대한 양의 정보를 70개가 넘는 소셜 세그먼트 세트로 변환했습니다.

이와 동시에, 집계된 신용카드 거래 패턴은 소비자 행동과 어떻게 소비자들이 시간과 공간에 따라 변화했는지를 이해하는 데 중요한 역할을 합니다. 마스터카드 지리정보 인사이트는 모든 소매업 분야의 소비자 지출의 변화를 측정하기 위해 매우 세밀한 측정 기준을 제공하여, 위치의 판매 기반 역학을 검증, 평가 및 벤치마킹 할 수 있도록 합니다.

이번 분석에서, 신용카드 거래와 지리 사회적 데이터의 관계뿐 아니라, 이러한 관계가 시장마다 어떻게 변화하는지도 알아보았습니다. 이러한 질문에 답하기 위해, LA와 시카고의 대도시 지역 데이터를 선택하여 공통점과 차이점을 조사해보았습니다.

먼저 신용카드 지출 데이터를 살펴본 결과, 레스토랑 매출 상위 지역을 파악할 수 있었습니다.

 

 

위의 지도에서 보듯이 시카고의 최고 매출 레스토랑은 주로 시내에 위치해있습니다. 반면 LA에서는 도시 전역에 퍼져있습니다. 시카고에서 저조한 매출을 기록한 식당이 최고 매출 식당과는 어떤 차이가 있는지, LA에서는 어째서 도시 전역에 최고 매출 식당이 퍼져있는지 한번 알아보았습니다.

분석을 위해, 가장 많은 매출을 올리는 지역을 알아보았습니다. 이 지역은 어떤 지역인가? 다행히도, 지리적 데이터는 이 질문에 정량적으로 답하는 데 도움이 될 수 있었습니다. 다음 차트는 신용카드 지출이 더 많은 식당이 위치한 지역에 대한 지역 사회 점수를 집계한 것입니다.

 

차트를 보면 최상위 레스토랑이 위치한 지역은 같은 사회적 세그먼트를 공유하고 있다는 것을 알 수 있습니다: LGBTQ 문화, 부의 신호, 남성 스타일, 와인 애호가. 이러한 세그먼트는 아주 흥미롭습니다. 이는 모두 트렌드, 도시성, 그리고 부에 대한 이야기를 들려줍니다.

물론 상위 세그먼트에는 몇 가지 차이점이 있습니다. LA에서 예상할 수 있듯, 영화 애호가들이 탑 세그먼트로 등장하고 있습니다. 이러한 차이점들은 아마도 서로 다른 부분들이 각 시장에서 레스토랑의 성공을 보여주는 긍정적인 지표라는 것을 암시합니다. 이를 알아내기 위해 가장 좋은 단계는 지리적 영역과 레스토랑 매출 데이터 사이의 상관 관계를 살펴보는 것입니다. 아래의 도표는 모든 상관 관계가 가장 강하고 두 도시간의 차이가 가장 큰 35개의 지리사회 분포를 보여줍니다. 도표는 시카고의 상관 계수에 따라 분류했습니다.

 

 

이 차트에는 많은 정보가 함축되어 있습니다. 이 포스팅에서 알 수 있는 그 이상의 것들이요. 이번 포스팅에서는 두 가지 주요한 사항에만 초점을 맞춰봅시다.

 

 

LA와 시카고의 레스토랑 매출에 관련된 강력한 사회적 행동 찾아내기

영화 러버, LGBTQ 문화, 요가 애호가와 같은 세그먼트를 보면, 레스토랑과 이들 세그먼트 간의 연관성은 시카고보다 LA에서 높습니다. 대부분의 세그먼트는 두 도시의 시장에서 같은 의미를 지니지만, 몇 가지는 다릅니다. 예를 들어, 파티 라이프는 LA에서는 매출에 긍정적인 영향을 주었지만, 시카고에서는 부정적인 연관성이 발견되었습니다.

시카고에서 비교적 좋은 영향을 끼친 세그먼트는 주로 풍경이나 관광지와 높은 연관성이 있었습니다. 볼 만한 관광지와 내추럴 뷰티는 시카고에서 긍정적인 연관성이 있었지만, LA에서는 아니었습니다.

이러한 차이는 두 도시의 입지 결정에 엄청난 영향을 미칩니다. 위의 결과에 따르면 같은 세그먼트에 기반하여 두 도시의 레스토랑 위치를 결정하는 것이 반드시 옳은 일은 아닙니다.

중서부와 시카고에 비해 진보적인 성향을 보이는 캘리포니아와 LA의 문화는 반문화적인 부분들이 식당 매출에 영향을 미칠 수 있음을 보여줍니다.

이 결과에서 보이는 가장 흥미로운 패턴은, 때때로 논쟁의 여지가 있거나 심지어 반문화적으로 보이는 부분들이 시카고보다 LA에서 더 큰 영향을 끼친다는 것입니다. 예를 들어 바디 아트, 힙합 컬처, 힙스터, 파티 라이프, 액티비즘 등은 모두 시카고보다 LA의 레스토랑에서 더 높은 상관 관계를 보였습니다.

상관 관계가 인과 관계를 의미하지는 않습니다. 하지만 어떠한 데이터가 왜 그런 결과를 만들었는지에 대한 가설을 세우는 것은 흥미롭고 유용한 일입니다. 이번 사례에서는 LA의 진보적인 문화는 열거된 행동을 보다 폭넓게 수용하고 있기 때문에, 이러한 행동이 식당 매출에 부정적인 영향을 줄 가능성이 적다는 가설을 세울 수 있습니다.

 

 

판매 잠재력을 평가하기 위한 로컬 인사이트

지리 데이터와 신용카드 거래 간의 관계를 보면 사람들의 사고방식, 관심사 및 행동이 특정 지역의 판매 잠재력과 관계가 있음을 알 수 있습니다. 분석에 인구통계학적 데이터만 사용하는 것은 각 커뮤니티의 고유성에 대한 더 큰 그림을 놓칠 수 있습니다. 이러한 분석을 통해 LA와 시카고의 레스토랑 매출은 같은 특성을 공유하기도 하지만, 차이점도 있다는 것을 알 수 있었습니다. 또한 이러한 차이를 고려하지 않거나 고려할 수 없는 경우 최적의 결과를 얻을 수 없습니다.

지리사회 데이터와 재무 데이터를 함께 분석함으로써 지역 주민만이 알 수 있는 정량화된 인사이트를 얻을 수 있습니다. 시카고의 경우 내추럴 뷰티 및 주요 관광지와의 접근성이 레스토랑 성공의 좋은 지표라는 것을 발견하는 것은 레스토랑 매출 데이터와 지리학적 변수를 연관시키는 것만큼이나 쉬웠습니다. 이는 분명해보일 수 있지만, 다른 방법으로 정량화하는 것은 매우 어렵습니다. 또한 LA에서는 동일한 상관관계가 그만큼 강하게 나타나지 않았다는 것도 주의하세요.

 

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.