ELECTION DATA VISUALIZATION

>>번외편 CARTOCSS: 원하는 색으로 데이터 값을 단계별로 나타내기 바로가기

4월 29일은 미국 내 정치적 성향의 양극화를 극명히 보여준 미 대선 최종 당선자 트럼프가 백악관에 입성한지 100일이 되는 날입니다. 이 현상을 교육, 소득이라는 사회적 맥락에서 이해하는데 도움을 얻기 위해 세계 여러 나라의 인구데이터를 바로 사용자의 지도에 올릴 수 있는 카토의 Data Observatory를 활용해 대시보드가 첨가된 지도를 만들었습니다. 아울러 같은 데이터를 다른 시각화 접근법으로 표현해 각 접근 방법의 장단점을 살펴봤습니다.

특히  5월에는 대한민국에도 대선이 예정되어 있어 지지율, 인구 데이터 등 다양한 위치기반 데이터의 표현에 대한 관심이 많아지리라 예상되어 아래 데이터 시각화 사례를 소개해 드립니다.

사회 지표에 따른 대선 결과의 차이

<교육, 소득 수준에 따라 대선 결과를 확인할 수 있는 인터랙티브 맵>

*블로그 템플릿 관계로 아래 스크린샷과는 다르게 대시보드가 오른쪽이 아닌 하단에 위치해 있습니다. 캡션을 클릭하시면 전체 지도 화면에 접속하실 수 있습니다.

미국의 지역 단위인 카운티(county)별로 트럼프(붉은색, 공화당), 힐러리(푸른색, 민주당)의 투표율을 나타낸 인터랙티브 맵입니다. 미국 인구데이터를 사용해서 고등학교 교육을 받은 인구비율(% of County with Higher Education), 소득 10만달러 이상 인구 비율 (% of County earning $100,000+)의 범위를 지정해 해당 지역을 볼 수 있습니다.

<인구 70% 이상이 고등학교 교육을 이수한 지역의 대선결과>

위젯에서 70% 이상의 인구가 고등학교 교육을 이수한 지역이 어디인지 지정해봤습니다. 클린턴 후보가 1천만 8백표로 670만표를 받은 트럼프에 압도적으로 승리했음을 확인할 수 있습니다. 대부분 큰 도시 또는 대학도시 입니다.

<인구 40% 이하가 고등학교 교육을 이수한 지역의 대선결과>

반면 고등학교 교육을 받은 인구가 40% 이하인 지역들에 한해서는, 트럼프가 약 280만표를 받아 124만표를 받은 힐러리를 크게 제쳤습니다. 미국 동부 애팔래치아 지방과 남부의 농촌 지역이 주로 눈에 띕니다.

<인구 30% 이상의 연 소득이 10만 달러를 넘는 지역의 대선결과>

이번에는 소득을 기준으로 투표수를 살펴봤습니다. 연 소득이 10만달러(한화 약 1억 2천만원)이상의 인구가 20퍼센트 이상인 지역에서는 클린턴이 약 3천3백만표로 2천800만표를 받은 트럼프를 꺾었습니다. 소득이 높은 지역에서 클린턴을 지지한 사람이 더 많았지만 교육 수준의 차이에따라 극명하게 나뉜 이전 데이터에 비해 큰 차이는 아니었습니다.

시각화 방식에 따른 장단점

하지만 위와 같은 등치 지역도(choropleth map)는 데이터 양상에 따라 한계를 보이기도 합니다. 큰 영역을 차지하고 있는 데이터가 작은 영역을 차지하는 데이터에 비해 시각적으로 부각되어 데이터 표현에 불균형이 생길 수 있기 때문입니다. 위 지도에서 보면 지도 대부분이 붉은색으로 물들어 마치 미국 국민들의 대부분이 트럼프를 지지한 것 처럼 보이지만, 위젯에서 확인하실 수 있듯이 실제로 클린턴은 전체 유권자 투표에서 6천2백만표를 얻어 6천만표를 받은 트럼프보다 우세했죠 (아시다시피 미국 선거제도에서 결정적인 역할을 하는 선거인단 투표(electoral vote)와 결과가 상이했습니다.)

<각 후보의 득표율을 원의 크기로 나타낸 맵>

한편 위 지도는 카운티 별 두 대선 후보의 득표율을 원으로 나타냈습니다. 동일하게 붉은색, 푸른색으로 승자를 나타내고 원의 크기로 득표율을 보여주고 있죠. 앞서 보여드린 등치 지역도가 붉은색과 푸른색의 실제 균형을 보여주지 못하는 것에 비해 원들의 크기로 실제 비율을 가늠하기 더 수월합니다. 하지만 등치 지역도에 비해 어떤 원이 어떤 카운티를 보여주고 있는지 등 위치적인 맥락을 인지하기가 어려워졌습니다. 반면 앞서 보여드린 지도에서는 사용자가 살고 있거나 익숙한 지역을 눈으로 바로 인지하고 결과를 확인하기가 더 쉬웠죠. 또한 인구가 많은 지역에서는 원이 겹쳐져 확인이 어렵다는 문제도 발생합니다.

이상으로 대선 결과 데이터와 사회지표 데이터를 통해 두 데이터를 지도에 얹어 이해할 수 있는 상관관계를 살펴보고 같은 데이터도 다른 시각화 방식에 따라 강조되는 정보가 다를 수 있다는 점을 알아봤습니다.

본 포스팅 내 CARTO에서 제작한 맵은 12월 19일 뉴욕타임스에서 제공한 대선 결과와 US Census ACS 2010-2014 데이터를 기반으로 만들었으며 알래스카 주는 카운티 단위로 결과가 제공되지 않아 제외되었습니다.이 포스팅에는 CARTO의 블로그 포스팅 WHAT DIVIDES THE U.S.? THE 2016 PRESIDENTIAL ELECTION VISUALIZED의 내용이 포함되어 있습니다.

>>번외편 CARTOCSS: 원하는 색으로 데이터 값을 단계별로 나타내기 바로가기


SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.