[구글맵 활용사례] 레스토랑이 훌륭한 음식을 빠르고 수익성있게 배달하도록 돕는 방법

오늘의 게시물은 Björn Wisnewski와 Ronny Rohland가 제공 한 것으로, 음식과 기술에 대한 애정으로 인해 식당가가 Google Maps Platform을 사용하여 온라인 주문 및 배송 서비스를 최적화하는 데 도움이 되는 관리 소프트웨어 인 SimplyDelivery 를 만들었습니다.

화면을 터치하여 문앞까지 음식을 배달하는 것은 이제 디지털 시대의 많은 사랑을 받고 있습니다. 그러나 많은 편의와 마찬가지로 작동하려면 많은 일이 보이지 않는 곳에서 일어나야합니다. 그 중 : 빠르고 효율적인 배송 서비스. 대규모 레스토랑 체인은 주문을 받고 배달하기 위한 자체 온라인 시스템을 구축 할 수 있습니다. 소규모 레스토랑은 타사 배송 플랫폼을 사용하여 수수료 요율을 부담해야 할 수도 있습니다. 이것이 바로 우리가 SimplyDelivery를 구축 한 이유입니다. 즉, 이러한 통합 시스템 구축과 관련된 선행 투자 및 비용없이 모든 규모의 레스토랑이 비즈니스를 온라인으로 전환 할 수 있도록 지원합니다. 

SimplyDelivery는 음식과 편리함을 사랑합니다. 그러나 기술자로서 우리는 훌륭한 음식을 빨리 배달하는 데 따르는 어려움을 이해합니다. 그래서 우리는 음식과 기술에 대한 애정을 결합하여 모든 규모의 레스토랑이 경쟁력을 유지하면서 고객에게 신뢰할 수있는 배달 서비스를 제공하도록 도울 수있는 방법을 고안했습니다.

SimplyDelivery는 식당가가 온라인 딜리버리 서비스의 모든 단계를 시각화하고 관리하기 위해 온라인으로 액세스 할 수있는 소프트웨어 관리 솔루션입니다. 웹 사이트에 주문이 접수 된 순간부터 고객의 문앞까지 도달하는 순간까지. 이 비즈니스에서는 전체 프로세스를 정확하게 추적하고 시간을 측정 할 수 있어야합니다. 그렇기 때문에 솔루션 구축 첫날부터 Google Maps Platform 에 의존하여 실시간 위치 데이터와 시장 최고의 현지화 기능을 통합 해 왔습니다 .

모든 규모의 레스토랑이 경쟁력을 유지할 수 있도록 지원 

고객은 온라인 주문 후 30 분 이내에 음식이 배달되기를 기대합니다. 이 벤치 마크를 일관되게 달성하려면 레스토랑이 운영 시간을 정확하게 지정하고 팀을 동기화하는 것이 중요합니다. 우리는 각 팀원이 필요로하는 정보를 하나의 통합되고 사용하기 쉬운 웹 애플리케이션으로 화면에 가져옵니다. 예를 들어 운전자는 휴대폰에서 SimplyDelivery 드라이버 앱을 사용하여 각 주문의 배송 주소에 액세스합니다. Place Details 및 Geocoding API 를 사용하여 각 목적지의 지리적 좌표를 운전자를 위한 자세한 시각적지도로 변환합니다 . 한편, 여러 배달 사이에있는 운전자는 이동 방식에 따라 제안된 최적화 된 경로를받습니다 : 자전거, 자동차 , 보도 ( 길 찾기 API 사용)

식당으로 돌아 오면 새로운 주문이 계속 들어옵니다. 따라서 주방에서 준비 시간을 맞추는 데 도움이 되도록 운전자가 다음 배달을 받기 위해 식당으로 돌아올 정확한 시간을 계산하여 음식이 도착했을 때 항상 신선하고 뜨겁게 유지합니다. (Distance Matrix API를 사용)

우리는 그들이 하나의 여행을 사용하여 여러 주문을 제공 할 수 있도록 식당 주인이 전략적으로 드라이버의 노선을 구성 할 수 있도록 Routes API를 사용하여 제안합니다. 결국, 배달 서비스의 수익성을 유지하기 위해서는 레스토랑이 시간, 연료, 운전자의 가용성과 같은 귀중한 자원을 최대한 활용하는 것이 중요합니다.

 

우리는 거의 알지 못했지만, 전 세계 대부분이 COVID-19로 인해 폐쇄되고 많은 레스토랑이 폐쇄해야하는 2020 년에 레스토랑에서 이러한 기능이 더욱 중요해질 것입니다. 식당가는 갑자기 사업을 중단하거나 배달을 시작하는 두 가지 옵션에 직면했습니다. 

이러한 상황에서 고객이 더 빨리 움직일 수 있도록 새로운 고객을위한 온 보딩 시간을 단축하기 위해 노력하고 있습니다. 웹 POS 시스템, 애그리게이터(여러 회사의 상품이나 서비스에 대한 정보를 모아 하나의 웹사이트에서 제공하는 인터넷 회사·사이트) 및 시간 추적 주문 도구와 같은 다양한 새로운 솔루션을 채택하는 대신, SimplyDelivery는 음식 배달을 시작할 수 있도록 이러한 모든 것을 하나의 웹 애플리케이션에 통합합니다. 더 빨리 시작할 수 있습니다. 이제 배달 서비스가 많은 레스토랑의 비즈니스 연속성에 필수적이되었습니다.

어떤 규모의 레스토랑이 네트워크로 연결된 세상을 빠르고 쉽게 활용할 수있을 때 우리의 사명은 성취 될 것입니다. 그때까지 우리는 식당가가 훌륭한 음식을 만드는 데 온전히 집중하면서 기술역량과 합리적인 가격으로 연결지어질 수 있도록 권한을 부여할 것입니다. Google Maps Platform의 신뢰할 수 있고 포괄적 인 데이터 덕분에 SimpyDelivery는 훌륭한 음식이 고객이 어디에 있든 원활하고 빠르게 고객에게 도달 할 수 있도록 지원합니다. 

 

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.

구글 지도 업데이트 – 자연은 사실적으로, 도시는 자세하게

구글 지도가 더욱 상세하게 업데이트 됩니다. 새로운 위성 색상 매핑 기술을 사용하여 구글 지도는 자연 기능에 대한 가장 포괄적인 뷰 중 하나를 제공하며, 지원하는 220개국 및 지역에서 모두 사용할 수 있습니다. 최근 출시된 구글의 클라우드 기반 맵 스타일링 도구를 사용하여 9월 15일부터 새로운 맵을 미리 보고 스타일을 조정할 수 있습니다. 

 

이러한 변화들은 지도에 완전히 새로운 장소감을 가져다 줄 것입니다. 

 

이제 크로아티아 해안, 섬, 내륙의 해변과 녹지를 확실히 구분할 수 있습니다

 

아이슬란드의 풍경은 이제 더 미묘한 차이를 보이고 있습니다. 아이슬란드에서 가장 큰 만년설인 바트나외쿨까지도 지도에서 확인할 수 있습니다.

 

이 아름다운 새 지도는 클라우드 기반 지도 스타일링을 통해 쉽게 채택할 수 있습니다. 9월 15일부터 클라우드 콘솔에서 새 지도 스타일을 작성하면 개선된 지도가 자동으로 제공됩니다. 기존 사용자 지정을 적용하고 스타일 편집기에서 변경 내용을 미리 보고 게시를 누르면 됩니다! 새로운 지도 채택에 대한 자세한 내용은 설명서(JS, Android, iOS)에서 확인할 수 있습니다.

사용자를 위해 새로운 기능을 설정하기 전에 새로운 기능을 더 자세히 살펴보면, 두 가지 옵션을 사용할 수 있습니다. 첫째, 지도에서 클라우드 기반 스타일링을 사용하는 경우, 9월 15일 이전에 간단히 스타일을 작성할 수 있습니다. 9월 15일 이전에 작성된 클라우드 기반 스타일은 2021년 초 모든 구글 지도 플랫폼 맵에 대한 업데이트를 롤링하기 전까지 기존 지도 색상표와 식생 방식을 유지합니다. 아직 클라우드 기반 맵 스타일링을 시도해 보지 않고 고객에게 향상된 지형 지물을 제공하는 게 급하지 않은 경우에는 어떠한 조치도 필요하지 않습니다. 지도는 2021년 초에 자동으로 업데이트됩니다.

구글 지도 플랫폼에 대한 자세한 내용은 당사 웹 사이트를 방문하시기 바랍니다.

 

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.

[한국가스신문] (주)SPH, 배관망 해석 솔루션 개발

– 표준제품으로 해석 정확성 보장
배관길이 확장 무관 비용 절감

▲ 에스피에이치가 개발, 보급에 나선 배관망 해석 솔루션(사진은 배관압력, 유량, 유속 해석과 예측 화면)

[가스신문=박귀철 기자] 공간정보 기반의 솔루션 전문 공급 및 GIS 소프트웨어 판매·컨설팅 전문업체인 ㈜SPH(대표 소광진)가 배관망 해석 솔루션(PLAS:Pipe Line Analysis Solution)을 개발, 보급에 나섰다.

약 1년간의 개발 끝에 완료한 PLAS는 글로벌 1위 업체의 표준제품으로 해석의 정확성이 보장되며 데이터 변환 모듈과 긴급상황 모듈 분석 등 다양한 확장 모듈을 제공한다. 또한 약 1주일 걸리던 해석 데이터모델 생성 기간이 2∼3시간으로 대폭 단축되어 업무 효율성이 증가하며, 사이트 라이센스 제도로 여러 부서에 추가 요금 없이 설치가 가능하며, 배관망 길이 확장과 무관하게 전체 비용을 절감할 수 있다.

특히 ▲배관의 압력과 유량·유속 해석 ▲데이터 오류 확인 및 분석 ▲긴급상황 분석 ▲정압기 영향도 분석 ▲데이터 모델링 ▲신규 배관 압력·유량·유속 값 예측이 가능하다.

이 회사의 소광진 대표는 “PLAS는 지하 배관 상태와 긴급상황 분석, 정압기 사고로 인한 영향도 분석 등 다양한 기능으로 도시가스사들의 안전에 기여 할 것으로 기대한다”고 밝혔다.

SPH는 이번 PLAS를 협력사인 모바일엔트로피(주)와 함께 전국 도시가스사를 대상으로 오는 9월부터 본격적으로 보급에 나선다는 계획이다.

▲ 긴급상황 및 차단 시 차단밸브, 배관, 수용가 확인화면

박귀철 기자 park@gasnews.com

출처: http://m.gasnews.com/news/articleView.html?idxno=92570

 

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.

[한국가스신문]인터뷰- 배관망 해석 솔루션(PLAS) 개발

[인터뷰] 배관망 해석 솔루션(PLAS) 개발한 ㈜SPH 소광진 대표이사
투자비 절감과 안정적 가스공급 도움

– 안전하고 효율적 가스공급 수행
처리속도 빨라 효율적 업무 가능

[가스신문=박귀철 기자] “미래 도시가스 산업의 화두인 ‘Digital Transformation’을 이루기 위한 한가지 실행 도구로 PLAS 1.0 솔루션이 사용될 수 있다고 봅니다. 도시가스 시설물 데이터의 정확한 관리와 분석을 통한 모델링은 정교한 배관망 해석과 시뮬레이션 기능을 활용할 수 있습니다. 이는 향후 가스 수급계획 수립을 비롯한 최적의 가스배관 설계와 이에 따른 투자비 절감, 안정적인 가스공급을 위한 기존 시설의 데이터 검증 효과를 기대합니다.”최근 도시가스, 천연가스, 송유관, 지역난방배관 등의 배관망 해석 솔루션(PLAS:Pipe Line Analysis Solution)를 개발한 ㈜SPH 소광진 대표이사(53)는 PLAS는 나아가 도시 안전을 위한 위험 분석, 상황 관제 기능을 통해 안전하고 효율적인 가스공급의 수행이 가능할 것이라고 밝혔다.

소광진 대표는 이번 PLAS는 글로벌 1위 제품인 DNV.GL사의 Synergi 모듈과 GIS S/W인 SuperMap 제품의 유기적인 결합을 통해 신뢰성과 안정성을 높였다고 강조했다.

“PLAS는 처리 속도가 매우 빨라 고객의 업무 생산성을 높였습니다. 1주일 정도 걸리던 해석데이터 모델 생성시간을 불과 2∼3시간으로 단축했고, 화면처리 속도 또한 3초 이내 표출되도록 했습니다. 아울러 고가의 솔루션 도입비용 부담을 줄였고, 배관망 길이 확장과 관계없이 정액제 요금을 제공하고 사이트 라이센스 정책으로 추가 요금 없이 여러 부서에서 사용할 수 있는 장점이 있습니다.”

배관망 해석 및 시뮬레이션은 도시가스사의 주요 부서 업무와 긴밀하게 연결된 중요한 시스템이라는 그는 영업부서 담당은 공급 가능한 투자계획 수립을 예측하고, 공사부서는 배관 설계 정보를 통해 관경과 시공방법을 정하고, 안전부서는 24시간 모니터링과 상황관리 모듈을 통해 차단밸브를 통제하고 신속한 위험 관리를 할 수 있게 한다며 배관 관리의 중요성을 강조했다.

PLAS 보급을 앞두고 코로나19가 걱정이라는 소광진 대표는 “비대면 시대에 대대적인 세미나를 개최하는 것은 어려움이 있습니다. 파트너사인 모바일엔트로피와 함께 도시가스사의 요구를 파악하여 적합한 맟춤 내용으로 정보를 전달하고자 합니다. 또한 온라인 회의와 소규모 세미나 개최, 다양한 동영상 자료를 적극 활용하여 PLAS를 보급할 계획입니다.”

코로나19는 전 세계 인류 앞에 닥친 시련이므로 이겨 내는 것이 중요하다는 소 대표는 비대면 아이템 개발과 보급도 필요하다고 강조했다.

“코로나로 인한 비대면 시대가 오히려 원격근무, 재택근무의 활용성을 높이고 있습니다. 임원이나 팀장은 직원들이 어떤 일을 하고 있는지. 프로젝트가 잘 수행되는지. 일의 진행단계는 어떤지 등 늘 궁금하죠. 이런 업무관리 협업 툴 시장에서 전 세계적으로 돌풍을 일으키고 있는 웹서비스 제품인 먼데이닷컴(monday.sphinfo.com)을 작년부터 국내에 소개하고 있습니다. 먼데이닷컴이 코로나19 비대면 시대에 오히려 영업 활성화로 100여개 이상의 기업이 사용하고 있습니다. 도시가스사나 LPG공급사 등에서도 도입할 경우 업무에 큰 도움이 될 것이라 봅니다.”

디지털 경쟁력이 더욱 중요한 시대가 되어 가고 있다는 소광진 대표는 기업이 새로운 혁신과 도전이 없다면 디지털 격차는 더욱 벌어지는 세상이 될 것이라고 밝혔다.

“SPH는 글로벌 트렌드와 한국 기업의 환경을 접목하여 비대면, 비접촉 시대 변화 속에 기업이 스마트한 작업이 가능하고 디지털 혁신을 지속할 수 있도록 지속적인 IT정보와 제품을 전달할 예정입니다. 특히 도시가스사들이 가스시설을 보다 효율적이고 체계적으로 관리를 할 수 있도록 도움으로써 상생 발전할 수 있도록 연구와 노력을 아끼지 않겠습니다.”

‘Online 공간과 Offline 세상, 공간과 사람의 이야기를 기술로 풀어냅니다’라는 모토로 2011년 SPH(Story Place Human)를 설립, 한국의 구글 지도 파트너사로 활동을 시작한 소광진 대표는 현재 한국 내 유일한 구글맵 프리미어 파트너로 공간정보분야 S/W인 SuperMap, CARTO, Digital Globe사의 제품을 150여개 기업에 영업 및 기술지원 활동을 하고 있다. 또한 클라우드 기반의 풍부한 S/W 서비스 경험을 바탕으로 기업의 다양한 업무를 효율화하고 일하는 방식의 변화를 기술적으로 지원하는 스마트 워크 웹서비스도 전문으로 하고 있다.

박귀철 기자 park@gasnews.com

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.

머신러닝 지도학습을 통해서 꼽아본 최적의 스타벅스 DT 장소!?

2부-2: 머신러닝을 통한 스타벅스 DT 최적의 입지 점수는?

인문사회 데이터기반 스타벅스 DT 입지조건 분석(featuring by AI)

지금까지 최적의 입지 변수를 가진 스타벅스 DT 장소들을 찾아보았습니다. 제 2의 최적의 스타벅스 DT점이 되기 위해 ‘어디에’ 스타벅스 DT를 입점시키는 게 좋을 지 찾는 과정의 마지막 단계에 이르렀습니다.  

저희 SPH 데이터 컨설팅팀에서는 다양한 데이터로부터 학습과정에 필요한 변수들을 추출하고, 이를 토대로 지도 학습 시행했습니다. 학습 결과 나온 모델로 ‘입지 점수’를 예측할 수 있습니다. 지도 학습 결과 산출된 ‘입지 점수’는 해당 지점이 스타벅스 DT 입점에 얼마나 최적화된 장소인지를 수치화한 결과 입니다.

A. [머신러닝 지도 학습]이란? 

  머신러닝 지도 학습은 비지도 학습과 달리 명확하게 학습해야 할 정답(혹은 target, 종속변수)이 있습니다. 지도 학습에서는 유동인구, 아파트 세대수, 대기업 정보 등의 feature 데이터(독립변수) 들만 주어지는 게 아닌, 해당 데이터의 정답이 학습시 함께 주어집니다. 이렇게 학습된 모델은 feature를 입력으로 받은뒤, 입지 점수를 출력하는 함수라고 할 수 있습니다. 

  모델의 성능을 좌우하는 건 양질의 데이터이므로, feature 뿐만 아니라 target 도 매우 중요합니다. 이런 점에서 스타벅스 DT 입지 점수와 가장 관련 깊은 target은 스타벅스 DT의 매출정보가 아닐까 싶습니다.

* 하지만 매출 데이터를 얻을 방법이 없었기에, 저희 나름의 알고리즘을 바탕으로 입지 점수를 선정하고 이를 target으로 하여 모델링을 진행했습니다. 

B. 분류화 & 그룹별 머신러닝 기반 분석

SPH 데이터 컨설팅팀은 정확한 머신러닝 알고리즘을 구축하기 위해 스타벅스 DT점들을 총 4분류로 나누었습니다. 전체 스타벅스 DT점들을 하나의 알고리즘으로 분석하는 것보다, 분류 후에 각 그룹별로 예측한 입지 점수가 더 높은 정확도를 나타내는 것을 확인하였습니다. 그 과정과 결과를 설명드리려 합니다.  

관광지 그룹으로 분류된 스타벅스 DT점들은 강변, 드라이브 코스, 관광지 근처인 특징들을 가진 DT점들을 분류한 그룹입니다. 또한 실질적으로 ‘유명 관광지’ 근처가 아니더라도 리버사이드팔당DT점과 같이 휴식을 목적으로 찾아오는 지점들을 간추려내었습니다. 이 지점들이 가지는 특징과 입지 변수를 토대로 스타벅스 DT의 입지와 관련하여 예측 분석을 해보았습니다. 예측 분석 후 가장 크게 영향을 미치는 변수들 TOP10을 소개드리려고 합니다.    

관광 그룹으로 분류된 스타벅스 리버사이드 팔당점 DTR 전경

1) 머신러닝 모델링 과정 및 결과

– 스타벅스 DT점의 Target 변수?

  지도학습을 통해 모델이 완성된다면, 이 모델을 통해 스타벅스 DT 입점 전에 내가 선택한 장소가 얼마만큼의 매출을 낼 수 있는 지를 예측할 수 있습니다.

  앞서 말씀드린바와 같이, 머신러닝 지도학습에서는 target 변수가 중요합니다. Target 변수가 무엇일까요? 스타벅스 DT 입지 분석에서쓰인 target 변수는 스타벅스 DT를 입점하기에 적합한 장소인지 아닌지를 구분하기 위해서 쓰이는 변수입니다. 좋은 입점 장소를 선택하는 데 있어서 중요한 변수는 각 DT점의 ‘매출’ 및 ‘토지의 가치’등이 있습니다. 

여기서 저희가 결정하기 위해 시도했던 변수들은 1.감성 지수가 포함된 Label, 2. 6개월 네이버 영수증 개수, 3. 공시지가 3년치 상승률, 4. 공시지가 3년치 평균입니다. 네 변수 중 다른 독립 변수들과 상관 관계 수치가 가장 높고 많은 독립 변수가 포함된 변수를 target 변수로 선택했습니다.

여기서 저희가 관광지에 스타벅스DT를 입점하기에 적합한 장소인지 아닌지를 선택, 구분하기 위한 값으로 선택한 중요 변수는 ‘공시지가 3년치 평균’입니다. 즉 53개의 영향을 미치는 입지 변수들이 평균 66% 정도 ‘공시지가 3년치 평균’과 상관관계가 있다고 할 수 있습니다. 

입점 예정인 장소를 머신러닝을 통해 예측하였을 때 공시지가 3년치 평균이 높게 나온다면 그 장소는 여러 독립 변수에 근거하여, 스타벅스DT점으로 높은 매출을 전망할 수 있을 것입니다.

2) 관광지에서 스타벅스 DT 매출 상승을 위한 중요 변수는?

머신러닝 지도 학습 결과, 왼쪽 Y축의 값은 관광지로 분류된 스타벅스DT점들이 가지는 중요 변수들을 나타내었습니다. X축은 입점 장소의 공시지가 상승, 하락에 어떠한 영향을 가지는 지, 변수의 중요도를 뜻합니다. (중요 변수들 중 10개 발췌)

예를 들어, ‘수요일’ 유동인구는 관광지에서 스타벅스 DT를 입점하는 데 영향을 미치는 변수들 중 가장 중요한 변수라고 볼 수 있습니다. 특히, 수요일날 유동 인구 수가 많다면 그 관광지로 분류된 스타벅스DT점은 매출이 높을 가능성이 큽니다. 

반대로, 수 km내 주요기업 수는 관광지에 스타벅스DT를 입점하기에는 영향력이 매우 적은 결과값을 가진다고 볼 수있습니다. 

이러한 변수의 부정, 긍정적인 관계와 중요도의 높고 낮음을 통해 관광지에 스타벅스DT를 입점하는 데 있어서 입점 장소의 변수값의 중요성을 알 수 있습니다.

**아래는 이러한 머신러닝 알고리즘을 구축하는 과정에 산출한 정확도와 모델 선택 차트입니다. 첫번째 그래프를 통해서 모델링 오차가 mae(평균 절대값 오차) 기준 0.04 정도로 예측을 잘 하는 알고리즘이란 것을 확인할 수 있습니다. 또한 두번째 차트에서 보이는 것처럼, 최적의 성능을 산출하기 위해 10가지 이상의 모델을 학습시키고 이중, 가장 최적화된 StepwiseLinear 모델을 선택했습니다.

**아래는 머신러닝 모델의 잔차의 분포를 나타냅니다. 잔차의 분포가 정규분포를 따름을 확인할 수 있습니다.

 

IC 근처로 분리된 스타벅스 DT점들은 대략 80여개로, IC 진입로에 위치하여 있거나 고속도로 근처 및 지리적으로 아파트 쪽을 입구로 향하지 않고 고속도로쪽으로 출입구가 향한 지점들입니다. 또한 정확히 IC근처가 아닐지라도 이 지점들이 가지는 특징들은 주변 아파트 및 거주민들을 위한 고객층이 아닌, 고속도로로 진입하여 다른 지역으로 이동하는 고객층을 위해 위치한 스타벅스 DT점입니다.  

IC근처 그룹으로 분리된 스타벅스 수원IC DT 전경

1) 머신러닝 모델링 과정 및 결과

위의 관광지로 분류된 스타벅스DT 모델 알고리즘 프로세스와 같이 IC근처로 분류된 스타벅스 DT도 Target 변수 선택이 중요한 단계입니다.

각각의 종속변수에 대해 feature들과의 상관관계를 분석했습니다. 위 차트의 핵심적인 수치를 요약한 그래프는 아래와 같습니다.

  위 그래프에서 볼 수 있듯이, 공시지가 3년 평균 결과의 feature개수와 값이 가장 높습니다. 49개의 다른 입지 변수들이 공시지가 3년 평균값에 평균적으로 44% 영향을 미칩니다. 이를 통해 종속변수를 선택하고 모델링을 진행했습니다.

2) IC 근처에서 스타벅스 DT 입점시 매출 상승을 위한 중요 변수는?

  위의 그래프는 IC 근처로 분류된 스타벅스DT점의 매출 상승에 영향을 미치는 요인이라고 볼 수 있는 변수들과 중요도입니다. IC근처에 주요기업 개수가 많을 수록 스타벅스DT 입점에 유리한 변수로 작용할 수 있습니다. 또한, 인근에 스타벅스가 존재한다면 오히려 매출 상승에 좋은 영향을 줄 수 있다는 결과를 가지고 있습니다. 주말에 교통량이 많을 수록 IC근처에 스타벅스 DT 입점이 긍정적인 요인이 될 수 있습니다. 

**최적의 성능을 산출하기 위해 가장 최적화된 AdaBoostRegressor 모델을 선택했습니다.

사업체로 분류된 스타벅스 DT점은 주변에 기업 캠퍼스, 산업단지 등이 위치해있어, 회사원들이 주요 고객층으로 자리한 DT점입니다. 대략 40여개의 스타벅스 DT가 사업체 그룹으로 분류되어있으며 이 그룹은 다른 분류 (관광, IC근처, 아파트)와는 다른 입점 변수가 크게 작용할 것으로 예상하고 있습니다.

사업체 그룹으로 분류된 스타벅스 광주신세계DT 전경

1) 머신러닝 모델링 과정 및 결과

사업체 근처로 분류된 스타벅스DT가 최적의 입점 장소인지 아닌지를 분류해내는 종속 변수를 선택하는 데 있어서 위의 프로세스와 같이 네가지의 변수들을 이용했습니다. 아래 그래프를 통해 53개의 다른 입점 변수들이 공시지가 3년 평균 결과값에 평균적으로 51% 영향을 미친다고 나옵니다.

다른 여타의 변수들보다 높은 변수 상관율과 많은 변수들이 영향을 끼치기 때문에 ‘공시지가 3년치 평균’을 사업체 근처 스타벅스DT 입점의 종속 변수로 사용했습니다.

2) 사업체 근처에서 스타벅스 DT 입점시 매출 상승을 위한 중요 변수는?

 사업체 근처에 스타벅스DT 입점시 중요한 변수는, 머신러닝 지도학습 결과 나타난 위의 변수들입니다. (중요 변수 10개만 발췌)  

이를 통해 사업체 근처 스타벅스 DT의 경우, 교통량이 많고 아파트 세대수가 많으며, 인근에 스타벅스가 위치해 있을수록 매출 성장이 높은 곳이라고 분석할 수 있습니다.

앞서 비지도 학습에서 1군집으로 분류된 ‘스타벅스 광주신세계DT’점은 위의 변수들을 어떻게 포함되고 있을 까요?

스타벅스 광주신세계DT점 사업체 근처로 분류된 스타벅스DT점 평균
동단위_아파트_세대수 10765세대 5123세대
교통량 점수 2.5 1.8
인근_스타벅스_거리 1.2km  1.9km
교통량_점수_평일 3 1.8
M_25 9803명 1693명
아파트_매매가_상한 3.3억 3.3억
06~09 28850명 7121명
M_59 13669명 3780명
M_34 13704명 3172명
M_60 31442명 6636명

위의 표와 차트는 머신 러닝 지도학습에서 나타난 중요 변수들에 따른 머신 러닝 비지도 학습에서 1군집으로 분류된 광주 신세계DT점 입지 변수 값의 비교입니다. 아파트 매매가 상한 변수를 제외한 모든 변수에서 평균적으로 스타벅스DT점들보다 굉장히 높은 변수 값을 가지고 있습니다. 이를 통해 비지도 학습에서 나온 1군집 사업체는 머신 러닝 지도학습에서 학습한 결과처럼 중요 변수에서 높은 값을 포함한다고 볼 수 있습니다. 

**최적의 성능을 산출하기 위해 가장 최적화된 AdaBoostRegressor 모델을 선택했습니다.

아파트 그룹으로 분류된 스타벅스 DT점은 총 90여개로 가장 많은 모집단을 포함하고 있습니다. 이 그룹은 주변에 IC근처 및 고속도로 진입로가 없으며, 유명 관광지가 위치하지않고, 크고 작은 산업체가 존재하지 않는 곳입니다. 반면에 주변에 아파트 및 거주 주택들이 많은 DT 지점입니다.

아파트 그룹으로 분류된 스타벅스 송파나루역DT 전경

1) 머신러닝 모델링 과정 및 결과

아파트 근처 그룹으로 분류된 스타벅스DT가 최적의 입점 장소인지를 분류해내는 종속 변수를 선택하는 데 있어서 위의 프로세스와 같이 네가지의 변수들을 이용했습니다.

다른 그룹과 같이 아파트 그룹도 공시지가와 관련된 종속 변수가 상관관계가 높았습니다. 반면, 각 종속변수에 따른 모델링 성능의 경우 ‘6개월 네이버 영수증 개수’를 종속 변수로 선택한 모델이 가장 높았기에, 종속 변수로 공시지가를 선택하지 않았습니다. 아마 아파트 일대란 그룹 자체가 이미 공시지가가 평균적으로 높기에, 변수간의 관계를 추정하는데 어려움이 있을것으로 예상됩니다.

아래 그래프를 통해 9개의 다른 입점 변수들이 네이버 영수증 개수 결과값에 평균적으로 26% 영향을 미침을 알 수 있습니다.

2) 아파트 근처에서 스타벅스 DT 입점시 매출 상승을 위한 중요 변수는?

위의 표와 차트는 비지도 학습에서 1군집으로 분류된 송파나루역, 광주상무, 온천장역 DT점과 지도학습에서 스타벅스DT 입점의 중요 변수로 선정된 TOP10과의 변수 값 비교입니다. 세 곳 모두 대부분 아파트로 분류된 DT점들의 평균 값보다 상위 값을 보유한다고 나옵니다. 특히나 유동 인구에서는 평균값보다 크게 상회한다고 볼 수 있으며 아파트 거리도 상대적으로 가깝다고 볼 수 있습니다.

**최적의 성능을 산출하기 위해 가장 최적화된 LinearSVR 모델을 선택했습니다.

 

앞서 학습한 모델은 해당 지역의 유동인구, 교통량, 아파트 세대수, 주요기업 정보 등을 토대로 공시지가에 기반한 입지점수를 예측하려고 합니다. 이제 이 모델을 이용하여 입지조건을 분석한 결과를 말씀드릴까 합니다.

입점시 높은 매출을 나타낼 것으로 예상되는 장소를 선정하고, 해당 지역의 변수 데이터를 모아 머신러닝 모델에 기반한 입지점수를 산출했습니다. 편의상 위 지역을 미래 전주만성 DT라고 명하겠습니다.

미래 전주만성DT의 위치

위 지역을 좋은 입지 후보로 선정한 이유는 아래와 같습니다.

  1. 국민연금공단 밀접 및 주변에 산업단지들 다수 분포 – 사업체 인근으로 분류 가능
  2. 호남고속도로 나들목 근처 위치 – IC 인근으로 분류 가능

위 지점은 사업체 인근 혹은 IC 인근 둘 모두로 분류될 수 있게, 각각의 모델로 예측 분석을 시도했습니다. 각 분류별 분포를 보면 예측값은 평균점수 정도로 높지 않아 보입니다. 하지만 전주시라는 지역 특성을 고려할 경우 위 예측값은 다른 양상을 나타낼 수 있습니다. 이를 확인하기위해, 전주에 위치한 DT점의 평균 입지점수와 미래 전주만성DT점의 입지점수를 비교해볼까 합니다. 

전주에는 ‘전주덕진광장DT’, ‘전주백제대로DT’, ‘전주송천DT’, ‘전주평화DT’, ‘전주효자DT’ 총 5 군데의 DT가 있습니다. 5군데 DT의 공시지가 평균값을 산출하고, 모델 예측값과 비교했습니다.

두 가지 모델의 예측 결과를 토대로 산출한, 미래 전주만성 DT의 입지점수 예측 범위와 앞서 소개한 5군데 전주 DT점의 평균값을 시각화했습니다. 입지점수 범위의 최솟값은 사업체용 모델의 예측값이며, 최댓값은 IC용 모델의 예측값입니다. 예측 범위는 전주지역내 스타벅스 DT의 공시지가 평균값 기준, 83% ~ 130% 범위를 나타냅니다. 범위 양 끝 값을 모두 고려할 경우, 전주만성 DT의 입지점수는 전주지역내에 있는 스타벅스DT 평균에 비해 성장가능성이 더 높습니다. 

그렇다면 전주만성DT로 선정한 위치의 현재 공시지가 입지점수를 기준으로 미래의 예측값을 비교하면 어떨까요?

현재 점수와 예측 결과 비교

현재 미래 전주만성 DT의 입지점수와 비교하면, IC 분류 모델과 사업체 분류 모델의 예측치는 각각 295%, 189%로 모두 높은 성장을 예측했습니다. 이는 평균적으로 242% 가량의 성장 가능성을 의미하기에, 전주만성에 스타벅스 DT를 입지하는 것은 괜찮은 투자로 보여집니다.

  저희 SPH 데이터 컨설팅팀은 스타벅스 DT점의 유동 인구, 교통량, 공시지가 및 스타벅스 DT 입점에 영향을 미칠 수 있는 여러 주변 변수를 머신러닝에 근거한 데이터 분석을 통해 과정 및 결과를 도출해냈습니다. 

  입지 전략 분석에서 중요한 변수로 꼽힐 수 있는 매출 데이터등의 부재로 예측 결과값이 상이할 수 있습니다. 하지만, 추가적인 내/외부 데이터 소스가 공급될 경우 더 높은 신뢰성을 띈 모델을 구축할 수 있고 한층 더 깊이 있는 컨설팅이 가능할것으로 판단됩니다.

  또한, 이번 입지분석 과정을 통해서 저희 SPH에서 구축한 머신러닝에 기반한 데이터 분석 파이프라인은 추후 다양한 산업 분야에서 활용될 수 있을 것으로 예상합니다. 스타벅스DT 입지 분석 뿐만아니라, 다양한 프랜차이즈 (다이소, 올리브영 등)와 호텔 업계(신라스테이, 롯데시티 호텔 등)의 입지조건에 최적화된 입지 선정을 할 수 있는 알고리즘을 구축할 수 있는 가능성을 확인했습니다.


김도환 데이터 컨설팅 전임 (dhkim@sphinfo.co.kr)

이소린 데이터 컨설팅 전임 (sllee@sphinfo.co.kr)

 

머신러닝 비지도학습으로 찾은 최적의 스타벅스 DT, TOP 4 !

2부-1: 머신러닝을 통한 스타벅스 DT 최적의 입지 점수는?

인문사회 데이터기반 스타벅스 DT 입지조건 분석(featuring by AI)

 

스타벅스 DT 입점 점수를 분석하고 결정하기까지 여러 알고리즘과 모델링과 같은 분석 기법이 사용됩니다. 데이터로 넘쳐나는 세상에서 중요한 변수와 중요하지 않은 변수를 솎아내는 것, 그리고 그 데이터들을 하나로 ‘정의’(Labeling)하는 것이 가장 관건입니다.

저희 SPH 데이터 컨설팅팀은 스타벅스 DT점 입점을 위한 입지 점수를 매기기 위해 머신러닝 지도 학습 및 비지도 학습을 통해 여러 변수들의 특징과 각 DT점이 가지고 있는 특징을 결합하여 의미있는 인사이트를 얻기 위한 과정과 결과를 보여드리려고 합니다.

 

A. [머신러닝 비지도 학습]이란? 

머신러닝 비지도 학습은 인간이 눈으로 결정짓지 못하는 것, 혹은 확실한 데이터가 없는 상황에서 다른 변수들이 포함된 빅데이터를 통해 패턴을 학습하여 새로운 데이터에게 학습된 패턴을 기반하여 분석하는 기법입니다. 예를들면 A점의 스타벅스DT가 전망이 좋을 지는 아무도 모릅니다. 하지만 모든 DT점들이 가진 변수들을 취합, 분석하여 비지도 학습을 통해 A점의 스타벅스 DT의 입지 점수를 매길 수 있습니다. 또한 변수의 중요도를 통해서 새롭게 입점을 하고 싶은 곳을 분석하여 학습된 데이터들을 통해 해당 장소의 입지 점수를 예측해 볼 수 있습니다.

군집 분석 K Means 알고리즘은 250여개의 스타벅스DT를 입지 변수 데이터에 근거하여 다섯개의 군집으로 제시했습니다. 스타벅스 DT점 입지 점수를 내는 데 갑자기 군집 분석을 적용한 이유는 무엇일까요? 같은 스타벅스 DT점이라도 고객들의 수요층, 방문 목적, 방문 시간대, 유동 인구 수, 주변 아파트 유무, 관광지 유무등이 큰 변수가 될 수 있기 때문입니다. 

예를들어 X점의 스타벅스 DT는 관광 목적으로 입점이 되는 곳이 있으며 Y점은 출퇴근길 고객들을 위한 입점이 목표가 될 수 있기 때문에 모든 DT점들을 같은 선 상에서 모델링을 하는 것은 정확한 점수를 매기는 데 어려운 일이 될 수 있습니다. 그렇기 때문에 군집화를 통해 더 세분화하여 각각의 군집들이 가진 특징을 살펴보는 단계를 가질 것 입니다.

B. 머신러닝이 분류한 스타벅스DT 군집은?

 

“머신러닝은 스타벅스DT를 5개의 군집으로 자동 분류하였다!”

Kmeans 군집화 알고리즘은 주어진 데이터를 K개의 군집으로 묶는 알고리즘으로, 각 군집과 거리 차이의 분산을 최소화하는 방식으로 작동하는 비지도 학습 기법입니다. 같은 군집의 경우 서로 비슷한 특징을 지니고 있으며, 서로 다른 군집의 데이터들은 이질적인 특징을 지니게 됩니다. 아래 표에서는 250여개의 스타벅스 DT가 5개로 잘 나뉘어져 있습니다. 하지만 군집 결과만 봐서는 왜 1군집이 4개의 DT점이 들어가 있고 4군집이 가장 많은 수의 DT점들이 들어가있는지 설명이 되지 않습니다. 이제, 이 군집을 시작으로 각 군집의 변수에 대한 특징을 살펴볼 것입니다.

C. 5가지 각 군집의 특성은?

1. 교통량 점수

교통량은 굉장히 중요한 변수 중 하나입니다. 교통량이 많다는 것은 잠재 고객이 될 수 있는 유동 인구가 많다는 의미입니다. 빠르게 흘러갈 수 있는 고객들이 ‘내리지 않고 커피를 마실 수 있는’ 플랫폼에 최적화되어 드라이브 스루를 이용하는 최적의 고객이 될 수 있기에, 이 변수를 살펴보겠습니다.

위의 군집별 교통량 점수는 주말, 아침, 점심, 저녁등 여러 분류로 스타벅스 DT를 통과하는 바로 앞 도로가 얼마나 붐비는 지에 대한 수치입니다. Y축의 점수가 높을 수록 교통량이 많은 곳이며 교통량이 적은 곳일 수록 평균 교통량 점수가 낮다고 보실 수 있습니다. 스타벅스 DT 교통량에서 나타난 점수로는 1번 군집이 가장 운전자들이 붐비는 곳으로 나타났으며 5번 군집으로 내려 갈수록 낮은 교통량을 보입니다. 즉, 1번 군집의 스타벅스DT점의 앞 도로는 다른 DT점들에 비해 굉장히 도로 교통량이 많다고 볼 수 있습니다.

2. 관광지 거리 및 리뷰 수

스타벅스 DT는 출퇴근하는 직장인에게만 매력적인 장소가 아닙니다. 관광지 주변의 DT는 일상에 지친 사람들에게 색다른 휴식 공간을 제공하기도 합니다. 특히, 경주 보문로 DT는 스타벅스 1호점으로, 인근 보문로가 경주 관광지로 유명한 곳이죠. 스타벅스가 이 곳을 시작으로 드라이브스루의 포문을 열었던 만큼 관광지는 핵심적인 입지조건중 하나입니다. 이와 관련된 변수인 관광지의 리뷰수와 거리를 분석해 보았습니다.

대한민국에 이름있는 관광지와 스타벅스 DT간의 거리, 그리고 관광지의 리뷰수를 통해 군집들의 차이가 있는 것을 볼 수 있습니다. 예를 들어, 1군집은 관광지 리뷰수는 굉장히 많고, 관광지와의 거리는 가장 가깝기 때문에 굉장히 유명한 관광지 주변의 스타벅스 DT일 수도 있겠다고 추측할 수 있습니다. 반면, 4군집은 관광지 리뷰수는 적고, 관광지와의 거리도 상대적으로 멀기 때문에 스타벅스 DT가 아파트 및 IC 근처의 입점 지역이라 추정할 수 있습니다.

3. 유동 인구 수

앞서 소개한 교통량도 중요한 변수이지만, 교통량은 스타벅스 DT지점에서 운전자를 포함한 전체 유동 인구를 담기에는 한계가 있습니다. 이를 보완할 수 있는 데이터가 유동 인구 수로, 얼마나 많은 사람들이 이동하고 움직이는 지를 나타냅니다. 아래 그래프를 통해 실제 스타벅스 DT지점 기준, 수 백 미터 반경에서 군집별, 요일별 유동인구 수를 나타내 보았습니다.

X축은 군집을 의미하며 Y축은 평균 유동인구 수를 의미합니다. Stack bar 그래프로 표시해봤을 때 1번 군집의 스타벅스DT의 반경 수 백M 이내의 유동 인구수는 어느 요일을 비교해서도 굉장히 많은 유동 인구수를 보입니다. 5번 군집의 금요일 유동 인구수는 2만6천여명으로 5번 군집보다 1번 군집이 10배 이상인 30만명의 유동인구 수를 나타내고 있습니다.

시간에 따른 그래프에서도 1군집은 5군집과 확연히 차이를 보이고 있습니다. 1군집의 스타벅스 DT는, 가장 붐비는 시간대인 15시~18시 사이에 평균 5만4천여명의 유동 인구가 포착되었습니다. 반면, 5군집의 동시간대 유동 인구는 5천여명으로, 1군집의 유동 인구는 5군집의 10배 이상입니다.  즉 1군집이 5군집에비해 10배 이상의 잠재 고객이 있다고 볼 수 있습니다.

4. 리뷰 점수

1부 스타벅스 입지조건 분석(https://www.sphinfo.com/starbucksdt)에서 소개드린 리뷰 점수도 하나의 히든 변수로 볼 수 있습니다. 서비스, 친절, 드라이브스루 이용의 편리함 등이 고객의 입장을 가장 잘 전달한 ‘입소문’의 수치화된 데이터라고 본다면, 이를 통해 어느 군집이 어떠한 ‘평판’을 지니고 있는 지 확인할 수 있습니다.

감성 분석을 통해 산출한 리뷰 점수를 통해 고객의 만족도를 추정할 수 있습니다. 리뷰 점수가 높다면, 고객의 만족도가 높기에 현재의 매출이 괄목할 만한 수치가 아니더라도 미래의 매출은 상승할 여지가 있습니다. 반대로, 어떤 DT점의 경우 현재는 매출이 상당히 높지만 리뷰 점수가 낮아, 매출의 상승세를 유지할 가능성은 낮아 보입니다.

1부에서 소개드린 감성 리뷰 분석을 통한 상위/하위 스타벅스 DT점

위의 스타벅스 DT점 리뷰를 통해, 비지도 학습에서 나누어진 군집들의 리뷰 점수가 어떻게 분포되어 있는 지 확인해보겠습니다.

아래의 막대 그래프를 보시면 1군집이 평균 0.33807점으로 압도적으로 높은 리뷰 점수를 보유하고 있습니다. 반면 3군집은 상대적으로 낮은 0.31203의 리뷰 점수를 나타내고 있습니다. 즉 1군집의 DT점들은 상대적으로 미래의 매출 지표에도 긍정적인 상승세를 보일 것으로 예상됩니다.

5. 네이버 영수증 리뷰 

네이버 영수증 리뷰는 고객들이 실제 스타벅스DT점에 방문하여 구매 후 리뷰를 남기는 형식의 리뷰 플랫폼입니다.

다른 포털 사이트의 리뷰 서비스와 다르게 실제 ‘구매’가 이루어져야 글을 작성할 수 있게 한다는 점에서 매출 짐작에 신뢰성이 높다고 판단하여 모은 데이터입니다. ‘매출’을 짐작할 수 있는 변수로 최근 3개월 간 해당 스타벅스DT를 다녀간 고객들이 남긴 영수증 리뷰와 갯수를 사용하였습니다. 전체 네이버 영수증 리뷰 갯수와 점수 데이터를 사용하지 않은것은 각 지점의 오픈일에 따른 오차가 없도록 하기 위함입니다.

위의 그래프처럼 1군집이 다른 변수들의 결과처럼 1등은 아니지만, 평균 3개월 영수증 개수 부문에서 79개로 상위권을 차지하고 있습니다. 이로보아, 1군집의 현재 매출은 다른 스타벅스 DT에 비해 상대적으로 높을 것으로 판단됩니다.

또한 1군집은 영수증 개수 값이 79개로 같은 3군집과 비교했을때, 리뷰 점수도 높은 점수를 받았습니다. 1군집의 경우, 매출과 고객들의 만족도 둘 다 모두 높다 할 수 있습니다.

1군집은 대부분의 변수들에서 좋은 수치를 지니고 있기 때문에, 굉장히 ‘탐낼만한’ 장소의 DT점임은 분명합니다. Kmeans 군집 분석은 hierarchy 분석이 아니기때문에 특징을 나타낼뿐 어느 군집이 열등하고 우등한지 나타내는 척도는 아닙니다. 하지만 군집별로 변수를 분석하여, 우리가 가지는 기대치에  부합하거나 더 높은 수치를 가지고 있는 DT점들이 모인 곳이 1군집인 것을 확인했습니다. 1군집 중 DT점은 송파나루역, 광주신세계, 온천장역 DT등으로 서울에만 집중되어 있지 않고 고루 분포되어 있음을 알 수 있습니다.

6. 3년 간 공시지가 상승률 및 평균 

공시지가란 건설교통부에서 조사, 평가하여 공시한 토지의 단위 면적당 가격입니다. 물론 부동산을 직접 사고 파는 실거래가와는 다르지만 정부가 세금을 부과할 때 주로 사용하기 때문에 스타벅스 DT가 들어선 장소의 값어치가 얼마나 올랐는 지 가늠해 볼 수 있는 지표가 될 수 있습니다.

여기서도 1군집이 3년 동안 가장 높은 공시지가 상승률을 보였습니다. 약 136%정도의 상승률을 보이며, 5군집의 24% 상승률의 약 6배이기 때문에 굉장한 차이라고 볼 수 있습니다. 또한 1군집은 평균 단위 면적당 976만원의 공시지가를 보유하며 320만원의 공시지가를 보유한 5군집보다 3배 이상의 가격을 보유한다고 볼 수 있습니다.

위의 군집 분석을 통해, 스타벅스 DT입지조건과 관련된 다양한 변수들에 대한 이해를 넓힐 수 있었습니다. 하지만 비지도학습으로 실제 입지점수를 예측하는데에는 한계가 있습니다. 비지도학습과 달리 지도학습의 경우 target 데이터를 필요로 한다는 단점이 있지만, 적합한 모델이 있을 경우 보다 높은 정확도로 예측이 가능합니다. 다음 포스팅에서 소개드릴 스타벅스DT 입지 점수 예측 분석은 머신러닝 지도학습을 이용한 결과입니다.

 

1부: 스타벅스 DT 소셜 데이터를 이용한 감성분석 바로가기

3부: 머신러닝 지도학습을 이용한 스타벅스 DT 입지점수예측 바로가기

 

김도환 데이터 컨설팅 전임 (dhkim@sphinfo.co.kr)

이소린 데이터 컨설팅 전임 (sllee@sphinfo.co.kr)

 

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.