런던 vs 뉴욕: 어느 도시의 평균 건물 높이가 더 높은가요? (+상권 분석, 입지 선정)

 

런던 vs 뉴욕. 이 두 상징적인 도시에 대해 많은 비교가 이루어졌습니다. 크기, 인구와 같은 요소는 말할 것도 없고, 삶의 질이나 최고의 피자집 같은 것들에 대한 비교도 있었습니다. 하지만 CARTO에서는 런던과 뉴욕의 부동산의 차이점에 대한 통찰력을 제공하기 위해 공간 데이터를 살펴보기로 했습니다.

이를 위해 지난 포스팅(지난 10년간 영국에 건설된 150만 채의 신규 주택 지도)에서 함께 작업했던 주택 및 공간 정보 전문가 Dan Cookson과 한번 더 함께 했습니다.

 

데이터 시각화

뉴욕시에는 총 6,000개 이상의 고층 빌딩이 있는데, 그 중 274개는 150m가 넘는 초고층 빌딩입니다. 그에 비해 런던에는 33개의 고층 빌딩 밖에 없기 때문에, 사람들은 뉴욕의 평균 건물 높이가 더 높다고 추측할 수도 있습니다. Dan은 이 가정을 테스트하고 뉴욕시 공공 데이터, Ordnance Survey Emu Analytics의 오픈 소스 데이터를 사용하여(OS Open Map Environment Agency LIDAR 데이터를 결합하여 런던에 유용한 빌딩 높이 데이터셋을 생성) 아래 나온 두 가지 맵을 만들 수 있었습니다.

 

 

 

맨해튼 중심부와 런던 중심부를 확대 해보면 뉴욕의 평균 건물 높이가 더 높다는 것을 볼 수 있습니다. 그러나 도시 경계까지 축소를 해 본다면, 두 도시 모두 사실은 8m가 조금 넘는 매우 비슷한 수치를 보인다는 것을 알 수 있습니다.

만약 다음 줌 퀴증 대한 어려운 질문을 찾고 계시다면, 이게 좋겠네요. 어느 도시의 평균 건물 높이가 더 높을까요? 답: 둘 다 아님 – 사실 같음.

 

 

추가 분석

추가 분석을 수행하면 뉴욕시의 5개 자치구에 걸쳐 몇 개의 낮은 건물이 있는지를 알 수 있으며, 쌍 최대치(Twin Peaks) 분포를 확인할 수 있습니다.

런던에 대해 동일한 분석을 수행하면 건물 높이 분포에서 유사하지만 덜 유의미한 쌍 최대치가 나타납니다. 그 이유 중 하나는 런던에 대한 건물 설치 공간 데이터가 낮은 건물 및 차고지를 포함하는 뉴욕의 데이터보다 덜 상세하기 때문일 수 있습니다.

이러한 유형의 건물 높이 분석과 지역 인구 밀도를 결합함으로써 우리 도시의 실제 거주 밀도를 더 잘 이해하고 설명할 수 있습니다. 이것은 세계 COVID-19 감염률이 도시 인구 규모와 밀도, 또는 실제 가구 규모와 어떤 관련이 있는지 알아내는 데도 도움이 될 수 있습니다.

 

 

건물 높이 분석은 부동산에서 쓰이는 하나의 지리 공간 예시입니다. 팀이 고려해야 할 연구에는 훨씬 많은 것들이 있습니다.

 

 

상업 시장 분석

대규모 CRE 회사 & REITS의 연구 및 데이터 사이언스 팀은 공간 분석에 의존하여 투자 전략의 품질을 개선하는 시장 통찰력을 제공합니다. 사무실, 상업용, 가정용 또는 소매용이든, 새로운 종류의 위치 데이터를 이용하여 기회를 확인하고, 수익률을 예측하여 점점 더 경쟁적인 시장에서 우위를 점할 수 있습니다.

 

상권 분석

인수합병에서 상권은 기존 또는 잠재적 사업장과 관련하여 잠재적인 인수 체인의 고객이 어디에 살고 있는지를 파악하는 데 필수적입니다. 분석가는 비즈니스 사이트와 연구 지역의 가구 수 사이의 거리별 고객 수를 비교함으로써 투자가 있을 수 있는 기회 또는 기존의 포트폴리옹 회사가 사라질 수 있는 가능성을 신속하게 알 수 있습니다.

 

 

입지 선정

입지 선정 과정에서 여러 위치 데이터 스트림을 이용하는 것은 최종 고객의 유입 및 상권을 이해하는 데 있어 매우 중요합니다. 소매업, 기업 사무소 또는 산업 단지 등, 모든 판매와 임대에 대해 가격을 정당화하는 것이 그 어느 때보다 중요합니다. 신용카드 거래나 인구 이동과 관련된 새로운 데이터셋을 가져오는 것은 빅딜을 성사시키느냐, 아니면 경쟁 업체에 빼앗기느냐를 결정할 수 있습니다.

 

 

 

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.

SuperMap AI 애니메이션 스타일 지도

지도는 정보를 전달하는 동시에, 예술적 측면에서의 시각적 산물이 되기도 합니다. 우리가 지도를 볼 때 가장 먼저 눈에 들어오는 것은 색깔입니다. 아름답게 채색된 지도는 정보를 더 잘 전달할 수 있고, 독자들에게 시각적인 즐거움도 줄 수 있습니다. 사실 체계적인 색 이론과 소비자 심리에 대한 지식이 부족하기 때문에, 어떤 사람들은 지도를 만들 때 색에 신경쓰지 않기도 합니다.

애니메이션은 항상 풍부한 색상과 멋진 균형감을 가지고 있습니다. 그래서 훌륭한 애니메이션 작품들은 보통 지도 색 매칭을 위한 영감의 원천이기도 합니다.

 

 

SuperMap iDesktopX에서 제공하는 AI 맵핑 기능 덕분에, 사진의 색을 지도에 “복사”할 수 있습니다. AI 맵핑 기능을 사용하여 애니메이션 장면의 색상을 지도로 마이그레이션 한 4가지 예시를 보여드리겠습니다.

 

 

시리즈 1: 창춘 시 지도

원본 이미지:

 

 

변환!

 

 

 

시리즈 2: 지형도

원본 이미지:

 

변환!

 

 

시리즈 3: 자금성 지도

원본 이미지:

 

변환!

 

재미있으셨나요? AI 매칭은 머신러닝의 K-평균 클러스터링 알고리즘을 기반으로 스타일 그림과 원본 맵의 주요 색상을 추출하여 영역 정렬 알고리즘에 따라 스타일 사진의 색상 매칭을 원본으로 빠르게 전송합니다. 그러면 이제 아름다운 지도가 완성됩니다.

SuperMap iDesktopX를 사용하면 작업을 쉽게 수행할 수 있습니다. 먼저 원하는 사진 한 장을 찾아 “AI Picture(AI 사진)”탭의 “Style Transfer(스타일 전송)” 그룹에서 “Custom Picture(사용자 지정 사진)”을 선택한 후, 마이그레이션 합니다. 지도 완성은 클릭 한 번으로 가능합니다!

 

 

 

또한, 사용자들은 “Color Adjustment(색상 조정)” 그룹의 버튼을 클릭하여 지도의 색상을 전환하거나, 흑백으로 만드는 등 여러 효과를 줄 수 있습니다.

 

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.

 

 

유동인구 데이터를 이용한 홍대 vs 여의도 요새 어떤가요 !?!?

 

영등포구에서 여의도 인근 지역은 직장인들이 많은 곳 중 하나입니다. 한편, 마포구 내 홍대(서교동), 연남동, 망원동 등은 최근 들어선 소위 ‘힙한 지역’이라고 불리는 곳이 많죠. 두 지역을 비교해 보면, 사회적으로 마포구 일대가 보다 트렌디한 것을 우리는 ‘느낌 적으로’ 알 수 있습니다. ‘느낌적’이 아닌 실제 데이터에서는 이런 트렌드가 어떤 식으로 나타날까요? 트렌드를 우리가 나름대로 정의할 수 있다면, 미래에 트렌디하다고 예상될 지역을 예측할 수도 있습니다.

 

들어가기에 앞서…

  트렌드란 단어가 참 추상적입니다. 이 포스트는 트렌드란 무엇인지를 파악하는 과정이라고도 볼 수 있습니다. 이 과정에 쓰인 데이터는 아래와 같습니다.

  1. SKT 유동 인구 데이터 (2019.09.11 )
  2. 인스타그램 크롤링 데이터 
  3. 휴게음식점 식품위생업소 현황 데이터

  위 데이터만으로 트렌드를 정의하기에 부족하지만, 한정된 데이터로 의미를 발굴하고자 노력했습니다. 이에 따라, 제약사항이 많습니다. 주말이 아닌 평일의, 하루 치 유동 인구 데이터만으로 일반화를 시도했고, SNS를 쓰는 인구만을 트렌드와 관련 지었으며, 부동산 데이터나 대중교통 데이터 등 다양한 요소들이 반영되지 않았단 점을 밝힙니다. 

  따라서, 트렌드와 관련된 인구의 특징이 특정 연령대, 시간대, 성별, 키워드로 쏠릴 수 있습니다. 하지만 절대적으로 다른 연령대, 다른 지역이 트렌디하지 않다는 것은 아닙니다. 이 포스트는 한정된 데이터 세트 내에서 얻은 결론일 뿐인 점, 양해 부탁드립니다.

 

SNS 상에 나타난 트렌드

  트렌디한 지역은 많은 사람들이 찾고, 가고 싶어하는, 또는 자주 가는 곳 이라고 생각합니다. 사람은 인상 깊었을 때, 어떤 순간을 기억에 남기고 싶을 때 사진을 찍습니다. 그런 점에서 SNS상의 포스트와 사진은 사람들의 선호도를 반영한다고 할 수 있습니다. 따라서, SNS 상에 얼마만큼의 포스트를 올렸는지를 토대로 해당 지역의 트렌디함을 파악해볼까 합니다.

행정동 별 누적 포스트 수 비교

  SNS에서 각 행정동 별 누적 포스트 수를 비교한 결과, 마포구 중에서 가장 많은 포스트 수를 차지하는 지역은 홍대(서교동)였습니다. 영등포구에선 여의도의 포스트 수가 가장 많았죠. 홍대의 포스트 수는 약 1천 6백만개로, 여의도 포스트 수의 8.5배였습니다. SNS상에서 두 지역의 트렌디한 정도가 뚜렷하게 차이가 났습니다. 

최근 일주일 누적 포스트 수와 총 누적 포스트 수의 경우 양상이 비슷하게 나타났습니다. 이 수를 기준으로 하면 가장 홍대, 연남동, 합정, 여의도 순으로 포스트 수가 많습니다. 하지만 최근 일주일 간 포스팅 비율은 연남동이 가장 높고 이후 홍대, 망원동, 합정 순서로 높습니다.

  최근에 포스팅 비율이 높은 지역일수록 트렌디하다고 생각할 수 있다면, 위 결과가 어느정도 의미가 있어 보입니다. 포스팅 비율로 보면 홍대(서교동), 연남동이 가장 높았고, 이후 망원동, 합정, 상수 순으로 높았습니다. 한편 직장인 지역인 여의도, 영등포는 포스팅 비율이 낮았습니다. 

이후 분석에서는, 위 분석 결과를 토대로 홍대, 연남동, 합정, 망원동 등을 트렌디한 지역으로, 직장인 지역인 여의도 일대를  트렌디하지 않는 지역으로 가정하고 진행합니다. 유동인구 데이터에서 트렌드가 어떻게 나타날까요?

 

 

 SKT 유동 인구 데이터를 다양한 시각에서 탐색하여 사회적으로 ‘트렌디’한 지역과 그렇지 않은 지역의 차이를 비교/분석해봅니다. 이를 통해 트렌드의 특징을 파악해보고자 합니다. 정리하면 아래와 같습니다.

  • 유동인구 데이터 EDA
  • 지역별/시간별 데이터 분석
  • 연령별 데이터 분석
  • 성별 데이터 분석
  • 트렌드 분석
  • 트렌드를 주도하는 인구의 특징
  • 트렌드 feature 탐색

 

지역별, 시간별 데이터 분석

우선 지역별, 시간별로 데이터를 시각화해보았습니다.

유출입 인구 정의

가시화를 해보니 문제점이 있었습니다. 해당 유동 인구 데이터는 실거주 인구수가 합쳐진 데이터였습니다. 해당 지역의 트렌드를 비교 분석하기 위해선 해당 지역의 실거주 인구수를 제외한 유출입 인구만을 파악할 필요가 있습니다. 

이를 위해, 가장 낮은 유동 인구 수를 나타내는 시간대인, 새벽 4시대의 인구를 실거주 인구수로 가정하였습니다.

유출입 인구 = 유동 인구 – 실거주 인구 (새벽 4시경 유동 인구)

시간대별 유출입 인구를 구하고 다시 그래프로 이를 표현해 보았습니다.

위 그래프에서 파란색 선은 마포구를, 초록색 선은 영등포구를 나타냅니다. 전처리 이후라 두 지역 모두 새벽 4시경에 유출입 인구가 0으로 나타나네요. 

행정동별 시간별 유출입 인구

위 그래프는 두 구를 비교한 것입니다. 구내에 여러 행정동이 합산되어 그래프가 그려지기에, 엄밀한 트렌드 비교 분석이 어려웠습니다. 행정동별로는 어떤 경향을 띠는지 살펴보았습니다.

그래프에서 보면 여의도와 홍대(서교동)가 가장 눈에 띄는데요. 히스토그램을 통해 좀 더 선명하게 비교해보도록 하죠.

적합한 행정동 선택

행정동별 모든 시간대 유출입 인구의 절댓값을 히스토그램으로 표현해 봤습니다.

 앞서 SNS 포스트 수가 가장 많았던 두 지역(홍대, 여의도)이 역시 유출입 인구도 많았습니다. 수많은 행정동의 트렌드를 분석하기에 앞서, 유출입 인구가 가장 많은 두 행정동을 비교했습니다. 일부 유출입 인구가 적은 행정동의 경우, 트렌디 하지 않다고 나타날 수도 있기 때문이죠. 이를위해, 영등포구에선 여의도, 마포구에선 홍대(서교동)를 선택하여 비교/분석하였습니다.  

여의도 vs 홍대(서교동) 시간대별 유출입 인구 비교/분석

시간대별 그래프를 통해 아래와 같은 사항을 확인할 수 있었습니다.

 

  • 여의도은 출퇴근 시간을 전후로 인구가 급격히 늘어나 10~11시에 최대치에 도달하고, 이후 지속적으로 감소합니다.
  • 홍대(서교동)는 19시까지 인구가 계속 유입되어 19시에 최대치에 도달하고, 이후로 점차 감소하기 시작합니다. 

  • 퇴근 시간 이후에 유입되는 18시 ~ 20시 인구의 경우, 홍대(서교동) 일대에서 문화생활을 즐길 것으로 예상할 수 있습니다.
  • 19~20시 사이 아직 남아있는 여의도동 인구는 야근 혹은 회식을 하는 직장인일 것으로 추정됩니다.
  • 트렌드는 해당 지역에서 늦은 시간대 여가활동을 하는 인구수와 관련있어 보입니다.

 

앞서 관찰한 두 행정동에서의 인구 변화를 지도 데이터에서도 확인할 수 있었습니다.

  위 분석을 토대로 본다면 늦은 시간대 (21시 이후) 유출입 인구수와 아침 시간대 (9시 이전)에 유출입 인구수의 차이가 트렌드의 특징이 될 수도 있습니다. 지역별로 이를 가시화하니, 처음에 SNS 데이터를 이용해 가정한 트렌디한 지역들의 경우 유출입 이 값이 +를 띄는 것을 볼 수 있습니다. 직장인 지역의 경우 -값을 나타냅니다.

 

 

 

연령대별 데이터 분석

다음으로, 인구의 연령대와 트렌드의 관계를 파악하고자, 연령대별로도 데이터를 시각화해보았습니다.

 

세로축은 세대를 나타내고, 가로축은 시간을 나타냅니다.

 

  • 여의도보다 홍대(서교동)의 유출입 인구 연령대가 낮습니다.
  • 여의도의 경우 30~40대 인구가 지배적입니다.
  • 홍대(서교동)에서 18시 이후 저녁 시간대의 연령대는 20대, 30대가 많고, 그중 20대가 가장 지배적입니다.
  • 홍대(서교동)의 경우 15~20시 사이, 10대 인구의 활동도 관찰할 수 있습니다.

 

  • 홍대(서교동)에서 퇴근 이후의 시간에 주로 활동하는 연령대는 20대와 30대 입니다.
  • 20, 30대 연령대가 트렌드와 관련 깊은 것으로 분석할 수 있습니다.

트렌드와 관련 깊은 인구의 연령대, 주된 활동 시간을 파악할 수 있었습니다. 그렇다면 성별은 트렌드와 어떤 관련이 있을까요? 

 

성별 데이터 분석

트렌드와 인구의 성별간 관계를 파악하기 위해, 유출입 인구가 활발한 시간대와 연령대를 선택하고 해당 데이터에서 성비를 시각화해보았습니다.

 

  • 여의도 인구의 남녀 성비를 보면, 20대의 경우 여성의 비율이 높지만, 30대부터 남성의 비율이 높고, 40, 50대의 경우 남성의 비율이 70%대를 차지합니다.
  • 여의도의 경우 퇴근 시간(17~18시) 이후 유출입 인구가 거의 없습니다.
  • 홍대(서교동) 인구의 경우 20대는 여성의 비율이 높고, 30대는 비슷한 비율을 차지합니다.
  • 홍대(서교동)에서, 22시 부터는 20대의 여성 비율보다 남성 비율이 높은 것을 관찰할 수 있습니다. 
  • 남성보다 여성들의 귀가 시간이 좀 더 이른 것으로 보입니다.

 

  • 앞서 정의한 장소, 시간, 연령대를 보면 20대의 경우 여성의 비율이 좀 더 높습니다. 30대의 경우 남/여 비율이 비슷합니다.
  • 트렌드는 특정 시간대 남녀 비율과 상관관계가 있어 보입니다.

정리

  SNS 포스팅 수를 기준으로 각 지역의 트렌드를 비교했습니다. 이를 토대로 트렌디하고 가정한 홍대와 직장인 지역인 여의도를 유출입 인구를 토대로 비교해보았고, 그 결과 트렌드의 특징을 파악할 수 있었습니다. 트렌드는 저녁시간대 활동하는 20, 30대 인구 (20대의 경우 여성이 좀 더 높은 비율) 와 관련 깊다고 할 수 있습니다. 그렇다면 해당 인구의 관심사는 무엇일까요?

 

 

트렌드와 관련된 인구의 관심사

크롤링 결과 (개인 정보 보호를 위해 흐리게 나타냈습니다.)

 

 트렌디한 지역의 관심사를  파악하여 트렌드에 대한 이해를 넓히고자, 홍대(서교동) 일대의 SNS(인스타그램) 데이터를 분석해보았습니다. 앞선 데이터와 결합하기 위해서 작성 시간과 위치 정보를 포함한 형식으로 크롤링했습니다.

 1700여개의 데이터를 수집했습니다. (인스타그램에서 하루 누적 요청수 제한을 두어, 데이터 수집이 충분치 않습니다) 데이터가 소량인 관계로 시간대별, 연령대별 가시화가 아닌 해당 지역의 데이터를 가시화하였습니다.

 

SNS 단어별 빈도수

워드 클라우드

  트렌디한 지역(홍대(서교동))의 주된 관심사는 디저트와 고양이, 타투로 나타납니다. 이중에서 디저트와 고양이는 디저트카페, 고양이카페 등은 프렌차이즈로 나타나기 보단, 해당 지역 고유의 카페(프렌차이즈가 아닌, 개인 카페)로 나타나지 않을까요? 

  홍대(서교동)/여의도 두 지역간의 개인 카페/프렌차이즈 카페 분포를 직접 분석해보고, 이러한 경향이 반영되는지 같이 확인해보시죠.

 

홍대(서교동)/여의도 카페 비교

두 지역간의 프렌차이즈 카페, 개인 카페를 비교해보았습니다.

이를 위해 서울 열린데이터 광장에서 “서울시 마포구 휴게음식점 식품위생업소 현황”, “서울시 영등포구 휴게음식점 식품위생업소 현황” 데이터를 이용했습니다. 업태명이 커피숍이 아니더라도 카페인 곳은 포함했습니다.

 

두 지역 모두 개인 카페가 많았지만, 홍대(서교동)의 경우 전체 카페중 92%가 개인 카페였습니다. 홍대의 개인 카페 비율이 더 높은 것으로 보아, 앞서 생각했던 가정(고양이, 디저트 관련 카페들의 경우 프렌차이즈 보단, 개인 카페로 나타날 것이다)과 어느 정도 일치하는 결과라 생각합니다. 다른 행정동에서도 이와 같은 양상을 띄는지 확인하고자 각 행정동의 개인 카페 개수 및 개인/프렌차이즈 카페 비율을 조사해보았습니다.

 

카페가 100개 이상인 행정동중에서 개인 카페개수(최대 개수 기준 비율)를 비교해보았습니다. 

홍대(서교동)와 여의도의 개인 카페가 가장 많았습니다. 하지만, 개인카페/프랜차이즈의 비율 1위는 홍대(서교동)가 아니었습니다.

 

개인카페 비율이 가장 높은 행정동은 연남동, 망원동, 홍대(서교동)이었으며, 가장 낮은 행정동은 여의도, 상암동, 영등포동이었습니다. 위 데이터는 처음에 분석한 ‘지역별 SNS 최근 포스팅 비율’과 관련있네요. 해당 데이터에서도 연남동, 망원동, 홍대가 높게 나왔었죠. 

  위 분석들을 토대로 트렌드의 특징을 나름대로 정의해보았습니다.

 

위에서 정의한 특징을 바탕으로, 트렌드와 관련된 feature(여기선 특징과 구분 짓기 위해 feature로 쓰기로 합니다.)를 정의해 보았습니다.

트렌드 feature 정의

  • 18시~21시경 20대 유출입 인구수
  • 21시~24시경 20대 유출입 인구수
  • 18시~21시경 30대 유출입 인구수
  • 21시~24시경 30대 유출입 인구수
  • 18시~21시경 20대 남녀 비율
  • 18시~21시경 30대 남녀 비율
  • 밤/아침 유출입 인구 차이 
  • 밤/아침 비교 유입 인구 여부 
  • 개인 카페개수
  • 개인 카페/프랜차이즈 카페 비율

밤/아침 비교 유입 인구 여부의 경우, 밤/아침간 유출입 인구가 양수일 경우 1을, 음수일 경우 0으로 나타낸 값입니다.

 각 행정동별로, 정의한 feature를 vector로 표현하면 다음과 같습니다.

 

정의한 feature들이 모두 트렌디한 지역와 관련깊은 요소일까요? 그렇다면 좋겠지만 아닐 경우가 더 많습니다. 이를 위해, 적합한 feature를 선택하는 과정을 진행했습니다.

 

트렌드 feature 선택

 

 트렌드와 보다 관련 깊은 feature를 선택하기 위해 상관관계를 분석했습니다. 각 feature 별로 계수의 값이 1에 가까울 수록 양의 상관관계가 높고, -1에 가까울수록 음의 상관관계가 높습니다. 0일 경우 선형관계가 없다고 할 수 있습니다.

 

 트렌드와 상관관계가 높은 feature는 순서대로 21~24시 20대 인구수(0.6), 18~21시 20대 인구수(0.59), 21~24시 30대 인구수(0.58)였습니다. 그리고 18~21시 30대 인구수도 높은 상관관계(0.49)에 해당하지만, 앞선 지수보단 높지 않았습니다. 

  개인카페/프렌차이즈 카페비율(0.49) 과 카페개수(0.46)의 상관관계도 높은 편에 속합니다. 이외에도 밤/아침 유출입 인구 차이, 18~21시 사이 20대 성비도 상관관계가 있었습니다. 앞서 분석한대로 30대의 성비는 상관관계가 낮았습니다.

분석 정리

  SNS 데이터, SKT 유동 인구 데이터, 카페 데이터를 토대로 트렌드의 특징을 정의해보았습니다. 정의한 특징중에서 가정한 트렌드와 유의미한 상관관계가 있는 특징들도 살펴보았습니다. 

추후 포스팅 주제

  보다 다양한 시간대, 지역의 여러 데이터들을 분석한다면 어느 지역에 대한 트렌드 지수를 정량화하고, 이를 기반으로 트렌드를 예측할 수도 있지 않을까요? 이는 추후에 진행할 예정입니다. 

분석은 이상으로 마치도록 하겠습니다. 번외로, 중간에 SNS 워드 클라우드에서 쌩뚱맞은 단어가 나왔는데요. 이와 관련한 내용을 말씀드릴까해요.

트렌디한 지역 답사

  워드 클라우드에서 1 순위로 꼽힌 딸기 타르트’, 실제로 정말 그렇게 맛있을까요? 제가 직접 가서 먹어보았습니다.

레드빅

레드빅은 딸기 타르트 관련 리뷰 1위 지점이었습니다. 레드빅 위치는 홍대(서교동)로, 홍대입구역에서 걸어갈 수 있습니다!

카페 외관은 입구에 벽돌과 조명이 있어서 그런지 뭔가 아늑해 보입니다. 딸기타르트 이외에도 많은 과일 타르트가 있었습니다.~ 저는 딸기 타르트를 구매했습니다.  어디에 앉을까 하다가 꽃이있는 테이블이 있길래 이 곳에 앉았습니다. 😊뭔가 연인들이 데이트하기 좋을 것 같네요 👍. 꽃이 있는 자리 이외에도, 공간 넓어서 개인이 와서 공부하기에도 좋아 보였어요. 😁 넘 맛있어서 순식간에 비워버렸습니다. ☺️ 위에 있는 딸기가 정말 상큼합니다. 조금 눅눅하지 않을까 걱정했는데 왠걸, 딸기가 정말 싱싱해요. 밑에있는 파이?도 맛있어요. 꼭 드셔보세요!!

 

피오니

피오니도 레드빅만큼 리뷰가 많았습니다. 여긴 딸기케이크가 더 유명했어요!

피오니 위치는 레드빅과 가까웠습니다~ 걸어서 5분 정도입니다만, 합정역에서 좀 더 가까울 것 같아요.

피오니 입구입니다~ 평일날 갔는데도 사람이 굉장히 많았어요. 레드빅도 많긴 했지만, 여기가 좀 더 사람들이 많아 보였습니다. 딸기 케이크를 먹을까 아니면, 위에 프레지에?를 먹을까 고민하다가 프레지에를 주문했습니다! 더 맛있어 보였거든요 😁😁

엇…. 아까 타르트를 먹어 배가 불렀는데도 불구하고 순삭했네요… 너무 맛있어요! 너무 달면 어쩌나 걱정했는데, 적당한 달콤함 + 딸기의 상큼함…  너무 잘 어울렸네요. 딸기 타르트도 맛있긴 하지만, 여기 딸기 케이크가 더 좋았습니다. 😍

장소나 분위기는 레드빅이 더 좋아보였어요. 저처럼 카페에서 공부하시는 분은 레드빅이 나을 것 같아요 ☺️

이상으로 포스팅을 마치겠습니다~ 긴 글 읽어주셔서 감사합니다. 😁

 

 

 


한정된 데이터였지만, 이번 분석을 통해 ‘트렌드’에 대한 이해를 넓힐 수 있었습니다.

이번 배움을 다음 포스팅에 반영하여,  더 좋은 정보를 공유하겠습니다.

Written and Analyzed by 데이터 컨설팅팀 김도환 전임


 

 

사용된 Tool

 

COVID-19 회복 분석에 사용 가능한 새로운 위치 데이터

 

세계보건기구가 COVID-19에 대해 팬데믹을 선언한지 두 달 이상 지났습니다. 전 세계 정부는 코로나 바이러스가 더 이상 퍼지는 것을 막기 위해 사람들이 집에 머물도록 하는 전례없는 조치를 취해야 했습니다. 자가 격리 조치가 바이러스의 재생산 비율을 조절하는 데 효과적이고 수십만 명의 생명을 구하는 데 도움을 준 것으로 입증되었으나, 세계 및 지역 차원의 경제에는 큰 타격을 주었습니다

몇 주간의 엄격한 락다운 조치 이후, 일부 정부는 현재 점진적인 경제 활동 재개 계획을 시행하고 있으며, 동시에 재택 조치도 서서히 해제되고 있습니다. 코로나 바이러스 발생이 다른 지역에 비해 일부 지역에서 더 많은 혼란을 일으켰던 것과 마찬가지로, 뉴 노멀로 접어들기 위한 이 계획은 모든 나라에 동시에 적용되지는 않을 것입니다.

로케이션 인텔리전스는 이미 바이러스 확산의 특성을 이해하는 데 중요한 역할을 수행했으며, 이처럼 불확실한 시기에 보다 효과적으로 대응할 수 있는 도구가 되었습니다. 이제 다음 단계로 나아가면서, 새로운 현상에 적응하고 리소스를 최적화할 때 행정부가 보다 정보에 입각한 의사결정을 내릴 수 있도록 지원함으로써 새로운 차원의 주목을 받을 것입니다.

 

Data Observatory에서 사용 가능한 새로운 공용 데이터셋

과학자와 분석가가 빠르게 변화하는 환경을 이해하는 데 도움이 될 인사이트를 얻을 수 있도록, CARTO팀은 Data Observatory의 새로운 공공 데이터셋을 포함한 데이터 공급 네트워크와 지속적으로 협력하고 있습니다.

 

감염률 및 위험 요인

Data Observatory에서 이용 가능하게 될 새로운 데이터셋 중 하나는 영국의 건강과 가구 데이터 공급업체 Doorda가 관장하는 것입니다. 이 데이터셋은 위험 요인(나이, 거주자 수, 흡연 습관 등) 및.COVID-19 감염률을 지역별로 추정하여 제공합니다. 주간 업데이트 덕분에 이 데이터셋은 영국 코로나 바이러스의 공간과 시간에 미치는 영향을 사회 경제적으로 분석할 수 있게 합니다.

 

 

 

소셜 미디어 반응

COVID-19의 발병은 우리의 일상 활동을 크게 변화시켰고, 평소에 하던 사회 활동의 루틴을 바꿔야만 했습니다. 지난 몇 개월 간 SNS와 디지털 플랫폼에서 사람들이 의사소통한 양상을 보면 이러한 모든 변화를 온라인에서 확인할 수 있습니다. 미국에 본사를 둔 지리 사회 데이터 제공업체인 Spatial.ai는 COVID-19를 언급하는 소셜 미디어 게시물의 정서를 분석하는 데이터셋을 구축했습니다. VADER(Valence Aware Dictionary and Sensitive Reasoner) 모델을 사용하여 계산된 정서 지표는 미국 카운티 별로 집계되고 매주 업데이트됩니다. 역학 지표과 카운티 별 자가격리 수준과 함께 소셜 미디어 정서를 활용하는 것은 사람들의 기분과 행동에 바이러스가 어떤 영향을 미치고 이것이 어떻게 진화하는지를 분석하기 위한 새롭고 통찰력 있는 방법입니다.

 

 

 

유동 인구 데이터

유동 인구 데이터는 COVID-19 위기 동안 가장 큰 영향력 있는 요소 중 하나였습니다. 이를 제한하는 것이 바이러스가 더 이상 퍼지는 것을 막는 가장 효율적인 방법 중 하나라는 것이 증명되었기 때문입니다. 이 주제에 대한 많은 언론 기사에서 볼 수 있듯이, 휴대 전화에 설치된 특정 앱에 의해 포착된 위치 신호의 집계를 바탕으로 한 인구 이동 데이터의 분석은 언론인, 연구가, 행정기관 등이 사회적 거리두기 시책의 유효성을 측정하기 위해 사용하는 가장 강력한 자원 중 하나였습니다. 또한 이 데이터는 소매 영역의 방문 패턴 변화를 측정하여 분석가들이 생필품의 재고를 이해하는 데에도 사용되고 있습니다.

애플의 이동 동향 보고서는 2020년 1월 13일 발행본과 비교하여 국가, 지역, 도시별 애플 지도의 길찾기 요청량을 보여주는 일일 지표를 제공합니다. CARTO 팀은 애플의 보고서에 추가적으로 다른 출처의 위치 데이터를 활용하여 데이터에 자세히 나와 있는 서로 다른 지리적 지역을 지오코딩하는 작업에 착수했습니다.

CARTO의 유동 인구 데이터 파트너 UnacastSafegraph는 다양한 공간 집합에서 이동을 측정한 특수 COVID-19 관련 데이터셋을 무료로 제공함으로써 연구 기관, 비영리 단체, 공공 기관 등의 연구에 힘을 실어주었습니다. 파트너들과의 긴밀한 협업을 통해, 이 데이터 프로덕트는 이제 “Data for Good” 이니셔티브에 참여하는 기관과 영리 조직의 상업적 라이센스 하에 CARTO의 Data Observatory를 통해 제공될 수 있습니다. CARTO의 플랫폼은 보조금 프로젝트를 통해 코로나 바이러스에 대한 연구를 수행하는 공공 및 민간 부문 기관에서도 사용할 수 있습니다.

Uncast의 사회적 거리두기 측정 지표는 현재 미국, 영국, 브라질, 멕시코, 프랑스를 포함한 몇몇 국가들의 경우 지역 차원에서 이용할 수 있습니다. 참고로 미국의 지표는 카운티 수준에서 집계되었으며 평균 이동 거리 변화 및 사람과의 만남 확률 변화에 대한 일일 측정값을 제공합니다.

SafeGraph는 블록 그룹 수준에서 집계된 지표로 사회적 거리두기 데이터셋을 구성했습니다. 매일 업데이트되며, 미국에 집중되어 있습니다. SafeGraph 데이터는 집에서 이동한 평균 거리, 하루종일 집에서 사용한 기기의 비율, 다른 사람들이 집 밖에서 보내는 시간 분포 등에 대한 정보를 제공합니다. 추가적으로 SafeGraph는 패턴 데이터셋의 “라이트” 버전을 COVID-19 연구에 필요한 리소스로서 매주 제공하고 있습니다.

 

 

저희가 Google Colab를 통해 공유하는 이 노트북은 위에서 언급된 CARTO의 Data Observatory 및 Google BigQuery에서 공개된 데이터셋에 접근하는 방법을 설명하고 있습니다.

 

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.

 

 

전주한옥마을 관광객 감소에 따른 분석과 활성 방안 (feat.전주 사람이 추천하는 전주 맛집 코스)

*전주 한옥마을 관광객 Reference

KBS 뉴스 – ‘한옥마을 천 만 관광 ‘붕괴’  코로나 19 이후도 걱정

전주 한옥마을 관광객 리뷰를 통해 방문객들이 주로 방문하는 이유에 대해 알아 볼 수 있습니다.

전주 한옥마을을 방문하는 이유는 ‘전통’ ‘음식’ ‘한복’등 전통적인 것을 참여하기 위한 부분이 많았습니다.

그렇다면 리뷰 중 감정 분석을 통해 부정적인 단어와 긍정적인 단어의 점수 합산으로 중립 or 부정적인 리뷰에 대해 더 집중해보도록 하겠습니다.

전주 한옥마을 방문에 부정적으로 감정 분석이 이루어진 리뷰들 중 ‘주차’에 관한 부정 리뷰가 12%를 차지했습니다.

그렇다면 Google 리뷰에서 부정 점수가 많은 관광객들이 생각하는 ‘주차’의 의미는 무엇일까요?

 

 

 

‘주차’를 언급한 부정 점수가 많은 리뷰들 중 같이 언급한 Top 20개 단어들로 연결망을 분석했습니다.

언급된 단어가 많을 수록 원의 크기가 커짐을 나타냅니다.

의미 연결망 분석은 연결 중심성이 아닌 고유 벡터 중심성 (Centrality)로 분석 했습니다.

중요 단어 중 연결된 다른 단어들의 중요성까지 분석하게 중심성을 나타냈습니다.

주차에  대해 ‘추천’하는 키워드보다 ‘공영 주차장’ 및 ‘사람’에 대한 키워드가 많으며, 중요한 키워드라고 볼 수 있습니다.

그 답을 위해 전주 한옥마을 전체 이용가능 주차장과 주차 면수를 확인했습니다.

(사진 클릭 시, 인터렉티브 가능한 페이지로 이동합니다)

주차 가능수가 가장 많은 주차장은 전주 한옥마을에서 2.7km 떨어져 있는 것으로 나옵니다.
전체 주차장 주차 가능 면수가 평균 150~300대이며 총 2,214대를 수용 가능합니다.

주차장을 추가적으로 넓히는 것 이전에 효율적으로 주차장이 이용되고 있는지 살펴보겠습니다.

(사진 클릭 시, 인터렉티브 가능한 페이지로 이동합니다)

 

유동 인구 중 100명 이상 모이는 곳을 밀집도로 확인했습니다.
P 표시는 주차장을 뜻하며 대부분 주차장 장소에 100명 이상 방문하는 것으로 보입니다.
하지만 가장 주차 면수가 많은 곳 (빨간 원)은 방문이 거의 없는 것으로 나타납니다.

2,214대를 수용할 수 있지만 600대 이상 수용가능 한 주차장은 이용되지 않고 있다면
관광객 입장에선 주차장 부족을 경험하기 충분한 것 같습니다.

유동 인구 데이터와 주차 장소 데이터를 분석해봤을 때,
주차 장소에 관한 홍보 부족 및 주차장 접근성 어려움이 크다는 것을 알 수 있습니다.
지자체와 관광객 간의 ‘소통’이 잘 안되고 있는 상황을 먼저 해결 한 후,
주차장 추가 시설 보충이 필요할 것으로 보입니다.

Tripadvisor의 부정 리뷰 중 두번 째로 언급이 많이 된 단어는 ‘체험’입니다.
전주 한옥마을에 방문하여 기억에 남을 만한 체험을 못하는 이유는

현재 전주 한옥마을 공식 사이트를 통해 체험 프로그램의 수와 장소를 알아봤습니다.
총 109개 이상의 월요일부터 일요일까지 운영하는 체험 프로그램이
전주 한옥마을 부근에 밀집하여 있습니다.
그런데 왜 ‘할 게 없다’라는 오명을 가지고 있을까요?

파란 점들은 실시간 이동 인구 데이터의 위치 별 밀집도를 의미합니다.
대부분 프로그램 체험 장소가 아닌 곳에 관광객들이 밀집해 있다고 볼 수 있습니다.

21개나 모여있었던 체험 프로그램 장소(빨간원)은 이동 인구가 거의 보이지 않는 것으로 볼 때,
‘홍보’의 필요성 및 체험 프로그램 장소의 ‘근접성’에 대해 생각해 볼 문제라고 봅니다.

관광객 수 감소는 전주 한옥마을의 관심도의 감소와 연결 될 수 있습니다.
만약 이런 상황이 지속 된다면, 향 후 전주 한옥마을의 관심도는 어떻게 변화 할까요?

Naver Trend와 Google Trend에서 관심도에 관한 데이터를 얻어 ARIMA 모델을 이용한
시계열 데이터를 분석 해봤습니다.

전주 한옥마을의 붐이 일어난 2016년 이후의 관심도 데이터를 통해 미래 1년을 ARIMA* 모형으로 예측해봤습니다.
그래프를 통해 전주 한옥마을의 관심도가 기존 평균 관심도 (54.93)에서 예측 평균 관심도(2.12)까지 떨어지는 것으로 나타납니다.

*ARIMA 모형은 과거의 데이터들을 사용하는 것을 넘어서 과거 데이터가 지니고 있는 추세(Momentum)을 반영한 모델입니다.

정상성 확인과 차분을 통해 데이터를 좀 더 예측가능한 모델로 만들었으며  자기 회귀 모델 (자신의 과거 값으로 미래 값 예측)로 관심도를 측정했습니다.

모델 (Parameter) 적합성 Reference*

전주하면 떠올릴 수 있는 것들이 몇 가지 있습니다.
주차, 체험이 부족 할지라도 ‘이것’ 하나를 위해 여행 계획을 세우기도 하는데요.

초코 파이, 비빔밥, 칼국수 등
전주를 방문하고 싶은 욕구(Desire)를 불러 일으키는 것에 대해 탐구해보려고 합니다.

(사진 클릭 시, 인터렉티브 가능한 페이지로 이동합니다)

2013년부터 전주 유명 명물의 프랜차이즈는 2019년에도 가속화 되었습니다.
‘전주 방문’에 큰 이유가 되었던 식당/명물이 더이상 전주에서 소비하지 않아도 되었습니다.

전주 방문을 해야하는 이유 중 중요했던 것들이 서서히 다른 지역에서도 소비가 가능하게 되어
전주 여행의 재방문 요인을 떨어뜨리는 점에 대해 시사할 수 있습니다.


아래 지도는 4일간 빅데이터 총 유동 인구에서 1300명 이상 밀집된 장소 (왼쪽)와
전주에만 있는 맛집 (전주 외 방문 가능 맛집 제외)와 유동 인구를 결합했을 때
전주 먹거리 탐방 코스로 제시 할 수 있는 지도 (오른쪽)입니다.

전주 토박이가 인정한 맛집

사진 클릭 시 해당 주소로 연결됩니다

 

 

 

 

 

 

 

 

 

 


전주 한옥마을의 주차장에서 발생하는 입출 관광객 수에 대한 정확한 데이터 수집의 한계가 있었지만
4일간 전주 한옥마을을 방문한 관광객들의 주요 방문 장소들을 통한 인사이트를 얻을 수 있었습니다.

또한 전주에서 오랫동안 살아온 토박이로써 입증 가능했던 맛집과 유동인구 데이터 분석을 결합시켜
전주 관광객들이 전주 한옥 마을 뿐만 아니라 여러 맛집을 다닐 수 있는 코스를 가시화 할 수 있는 시간이였습니다.

Written and Analyzed by 데이터 컨설팅팀 이소린 전임


*ARIMA 모델 적합성 및 Residual check 관련 Reference

시계열 그래프에서 특정 계절/월에 관심도가 상승하는 계절성이 보였기 때문에 ARIMA 모형에서 계절성 패러미터를 포함시킴.

Feature는 Google 및 Naver 포털 관심도 합산으로 기존 관심도 지수와 상이할 수 있음.

예측값은 장기 예측으로 기간이 예측 정확도에 영향을 줄 수 있음.

 

 

 

 

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.

미국 시위 & 경찰 폭력 시각화 (#BlackLivesMatter)

얼마 전 조지 플로이드가 경찰 구금 중에 비극적으로 사망한 사건으로 시작된 시위가 미국 전역으로 확대되었습니다. 다른 사회적 문제와 마찬가지로, 경찰 폭력의 규모를 이해하려면 데이터를 분석하고 시각화해야 합니다. 이것이 경찰 폭력 맵핑입니다. 직접 이런 작업을 수행하고 싶다면 CARTO grant를 신청하여 #BlackLivesMatter 운동의 일환으로 지도를 작성할 수 있습니다.

 

 

경찰 폭력 맵핑

2019년 미국에서 경찰이 1099명의 시민을 죽였습니다. 흑인은 인구의 13%에 불과함에도 불구하고 사망자의 24%를 차지했습니다.

이 수치는 경찰 폭력이 지역 사회에 미치는 영향을 계량하기 위해 전국 경찰 살인에 대한 종합적인 자료를 수집한 공동 연구 Mapping Police Violence에 의해 발표되었습니다.

수집한 데이터는 가장 규모가 크고, 포괄적이며, 공정한 세 개의 크라우드 소싱 데이터베이스로부터 가져왔습니다.

 

또한 이 데이터 외에도, 소셜 미디어, 부고 자료, 범죄 기록 데이터베이스, 경찰 보고서 및 기타 출처를 검색하여 데이터베이스 내 전체 피해자의 90%를 식별하는 등 데이터의 품질과 완전성을 더욱 향상시키기 위해 광범위한 독창적인 연구를 수행했습니다.

아래의 애니메이션 지도는 2019년에 일어난 경찰 살인 사건을 시각화한 것입니다.

 

 

 

 

소셜 미디어 반응 맵핑

최근 게시물에서 Spatial.ai와 같은 제공업체의 위치 기반 소셜 미디어 데이터 (Geosotial 데이터)를 분석하고 시각화할 수 있는 방법을 살펴 보았습니다.

지난 주 #ICANTBreathhe, #BlackLivesMatter 및 #HandsUpDontShoot 를 포함한 해시태그 트렌딩을 아래 지도에 시각화했습니다.

 

 

이 시각화는 미국에서 일어난 사건이 미국 국경을 훨씬 넘어서까지 퍼지고 있다는 것을 보여줍니다. 베를린, 런던, 토론토 등 다른 국가의 도시에서도 수많은 시민들도 #BlackLivesMatter 운동에 힘을 실어주기 위해 시위에 나선 것을 알 수 있었습니다.

 

 

 

시위 맵핑

뉴욕 타임즈에서 말표한 아래 지도는 발행한 날짜(5월 31일)에 일어난 시위의 규모를 보여줍니다. 시위는 140개 도시로 확산되었으며 21개 이상의 주에 국가 방위군이 배치되었습니다.

 

 

CARTO는 인종차별과 혐오를 반대하는 지역 사회와 연대합니다. CARTO는 보조금 프로그램을 통해 인종 평등을 달성하기 위한 데이터를 시각화하거나 지리 공간 분석을 수행하는 비영리 단체들을 장려하고 있습니다.

 

 

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.