여의도 직장인들을 위한 찐맛집은?

여의도 직장인들을 위한 찐 맛집은?

(1만 5천 개 이상의 맛집 리뷰 데이터 분석!)

“점심 뭐 먹지?”

 

직장인들의 중심지, 여의도에서 맛집을 찾는 것은 회사원들에게는 중대한 결정 사안 중 하나입니다. 대부분 입소문으로 식당을 가거나 인터넷 속 ‘후기’들로 소중한 점심 메뉴를 결정짓죠. 인터넷에는 식당 리뷰를 볼 수 있는 플랫폼이 매우 많지만, 업무로 바쁜 직장인들에게 일일이 모든 리뷰를 찾아보는 건 어려운 일입니다. 더군다나, 힘겹게 찾아낸 식당이 맛집이 아닐 경우 허탈감이 이루 말할 수가 없습니다. 누구나 한 번쯤은 블로그 리뷰를 보고 갔다가 실망하고 돌아와 봤을 거라 생각합니다. 

 

‘수많은 맛집 찾기 플랫폼에서 과연 어떤 정보가 믿을 만한가? 진짜 맛집을 찾을 수 있게 알려주는 정직한 곳이 없을까?‘ 

 

이번 포스트는 이와 같은 문제에 대한 저희 SPH 데이터 컨설팅팀에서 찾아낸 나름의 해답입니다. 맛집은 주관적인 요소를 상당히 많이 포함하고 있기에, 저희의 솔루션이 범용적인 모범 답안일 수는 없음을 말씀드리고 싶습니다.

우선 맛집과 관련된 모든 포털 사이트의 리뷰 정보를 취합하고 분석하는 과정을 보여드리려 합니다. 분석 과정에서 저희는 3가지 관점을 기준으로 삼고 각 기준별로 맛집 순위를 매겼습니다. 이러한 배경에는 앞서 말씀드렸듯이, 맛집에 대한 기준은 주관적이기에 1가지 관점만으로는 순위를 매기기가 어렵다는 데 있습니다. 저희 SPH 데이터 컨설팅팀은 ‘맛집 탐방러’에게 보다 신뢰할 만한 정보를 제공함으로써, 작게나마 여의도에서 식사하시는 분들께 소소한 행복을 전해드리고 싶습니다.

 

0. 맛집 리스트 선정

처음부터 전국 맛집을 모두 분석하기엔 음식점 개수가 너무나 많았습니다. 천 리 길도 한 걸음부터라고, 전국지점을 분석하기에 앞서 작은 한 지역부터 분석해보기로 했습니다. 이를위해, 저희가 근무하는 곳인 여의도 지역 내의 일부 맛집 데이터만을 분석해보고, 추후 (반응이 좋을 경우) 확장하기로 했습니다. 일종의 pilot study 개념으로 진행하였지만, 이번 분석을 통해 데이터 수집에서부터 분석까지 전체적인 파이프라인을 구축하였습니다.

여의도 찐 맛집을 조사하기에 앞서, 여의도 맛집 리스트 목록이 필요했습니다. 망고플레이트는 구글에 ‘맛집 검색’으로 검색하였을 경우 1순위로 등장하는 사이트입니다. 다이닝코드와 식신, 메뉴판 닷컴 등도 있지만 망고플레이트의 영향력이 아직 제일 높다고 생각하였기에 망고플레이트를 기준으로 맛집 리스트를 선정했습니다. 

망고플레이트에서 ‘여의도 맛집’이라고 검색할 경우 총 44개의 장소가 나옵니다. 한식, 일식, 양식에서부터 카페, 뷔페까지 다양한 업종의 장소들이죠.

이 44개 맛집의 주요 포털 사이트 5곳의 후기들을 취합하여 ‘진짜 맛집’을 보여드리려고 합니다.

 

1.리뷰 지수 

  리뷰란 가보지 못한 곳을 먼저 개척한 사람들에게 듣는 스토리이기도 합니다. 식당을 먼저 가본 고객들이 써 내려간 솔직 담백한 후기들을 보고, 우리는 해당 식당을 방문할지 말지를 한 번 더 고민하게 됩니다. 일부 광고성 리뷰를 제외하고, 대체로 리뷰가 긍정적인 식당이라면 ‘무난하게’ 점심을 즐길 수 있습니다. 리뷰를 통해 얼마나 맛있는지에 대한 점수를 매길 수 있습니다.

단, 이때 사용되어야 할 리뷰는 신뢰할만한 데이터여야겠죠. 리뷰 데이터가 신뢰성을 가지기 위해선, 광고성 리뷰나 의도적인 영업 방해 의도로 작성된 리뷰를 가려낼 수 있어야 합니다. 저희 SPH 컴설팅 팀에서는 리뷰 데이터로부터 신뢰성있는 정보를 추출하기 위해 평가하는 사람의 패턴과 점수 분포, 개수 분포 등을 반영하였습니다. 이를 바탕으로 텍스트 데이터에 대한 감성분석을 진행하고, 리뷰와 관련된 여러 메타 데이터와 조합하여 리뷰 지수를 산출했습니다.

 

데이터 분석 전문가가 분석한 단순하지만 정교한 맛집 리뷰 지수!

구글, 네이버, 카카오 등 식당 후기를 찾을 수 있는 플랫폼은 무궁무진합니다. 저희는 주요 포털사이트 5곳에서 최근 6개월 동안 고객들이 남긴 개별 리뷰 점수들을 총 취합하였고, 앞서 소개해드린 과정으로 저희 나름의 리뷰 지수를 산출했습니다. 리뷰 지수를 통해 산출된 결과는 카테고리별로 위 그래프와 같이 나타낼 수 있습니다. 한식에서는 진주집이, 일식에서는 아루히, 양식에선 테이스팅룸, 중식에선 라무진, 카페에서 그레이에스프레소가 높은 점수를 차지했습니다. 

 

리뷰지수 산출에 쓰인 딥러닝 기반 감성 분석

리뷰지수에는 리뷰의 점수 분포나 리뷰를 단 사용자의 패턴뿐만 아니라 텍스트 자체의 *감성 분석 결과도 포함되어 있습니다. 단순히 포털 사이트별 리뷰 점수를 취합한 수치가 아닌, 딥러닝을 통해 해당 식당에서 올라온 모든 후기 글의 감성 점수를 취합하였습니다. 또한 각 플랫폼에 나타난 식당 전체 평균 점수에서도 상대적으로 긍정의 비율이 높은 식당에는 가중치를 더 많이 주는 방법을 통해 차별화를 두었습니다.

 

 

이때 쓰인 감성 분석을 간략히 표현한다면 위 그림처럼 나타낼 수 있습니다.  우선 리뷰 텍스트 데이터내 단어들을 벡터로 임베딩 시켜줍니다. 임베딩을 통해 생성된 벡터를 딥러닝 모델의 입력값으로 활용합니다. 단어 임베딩 기법을 사용하였기에 단어들은 주변 문맥 정보를 반영하고, 딥러닝 모델로는 양방향 LSTM을 사용하여 언어 문법 구조의 복잡한 측면도 잡아낼 수 있습니다. 그 결과 적절한 확률값을 예측할 수 있고 이를 이용해 감성 분석을 시행하였습니다.

*감성 분석이란 문장을 형태소 단위로 분리하여 문장의 긍정 및 부정의 비율을 예측하는 기법입니다. 문장의 마지막 단어들에 높은 가중치를 매기는 LSTM 모델이 아닌 초반에 나온 단어들도 가중치를 높게 두어 예측하는 모델인 양방향 LSTM을 사용했습니다. 또한 15만 여개의 네이버 리뷰 데이터로 학습시켜 예측 정확도를 높였습니다.  

참고 문헌) Bidirectional Recurrent Neural Networks, Bidirectional LSTM Networks for Improved Phoneme Classification and Recognition

 

 

2. 리뷰 트렌드

“여기가 인기 식당이라는데 난 잘 모르겠는걸?”

오래전부터 오픈한 식당들은 당연히 리뷰 수도 많기에, 리뷰 데이터에서는 신규 식당보다 유리한 위치를 선점할 수 있습니다. 또한 예전엔 맛있었지만, 최근엔 맛이 변하여 예전만 못하거나 혹은 예전보다 훨씬 업그레이드된 식당들도 있을 수 있습니다. SPH 데이터 컨설팅팀에서는 여의도에서 ‘최근’에 핫한 식당들과 다소 인기가 떨어진 식당들을 보여드리려고 합니다.

최근 3개월간 식당을 다녀간 고객들의 후기가 좋아졌거나 나빠졌다는 것을 판가름할 수 있는 플랫폼은 지금까지 없었습니다. SPH 데이터 컨설팅팀에서는 최근 3개월간 리뷰의 평균 변화량을 다각적으로 분석하였습니다. 한식에선 정인멱옥, 일식에선 카레오, 양식에선 그리너리 샐러드, 중식의 경우 서궁, 카페는 아이엠베이글과 패트릭스와플이 최근 3개월간 사랑을 받고 있는 곳이네요. 그에 비해 진주집, 아루히, 테이스트링, 오헨과 뷔페 업종은 이전보다 고객의 발길이 뜸해졌습니다.

 

리뷰 트렌드에서 높은 수치는 해당 식당이 기존에 방문하던 고객 수와 비교했을 때, 더 많은 고객이 방문했거나, 평가가 이전보다 상대적으로 좋아졌다는 것을 의미합니다. 반대로 특정 식당의 수치가 낮을 경우, 해당 식당은 이전보다 고객의 방문이 뜸하거나 종전의 평가에 비해 최근 고객들의 평가가 낮아진 곳을 의미합니다.

가령 특정 식당의 금월 리뷰 수가 100개라고 합시다. 만약 전월 리뷰 수가 10개라면 해당 식당의 트렌드 지수는 높은 값을 띌 가능성이 높습니다. 반면, 전월 리뷰 수가 1000개였다면 오히려 감소하는 추세를 나타내기에 트렌드 지수는 낮은 수치를 기록할 것입니다. 물론 점수도 같은 맥락으로 파악해봐야 정확하게 알 수 있겠지만요. 리뷰 트렌드를 기준으로 최근에 뜨고 있는 식당을 방문해보는 것도 좋을 것 같습니다. 

 

출처: https://www.chosun.com/site/data/html_dir/2020/08/21/2020082100322.html

다만, 리뷰 트랜드의 경우 최근 코로나 바이러스의 영향이 반영될 수밖에 없습니다. 가령, 공간이 협소하거나, 다수의 사람들이 한 곳에 모일 수 밖에 없는 뷔페 같은 경우가 좋은 예입니다. 이런 곳의 경우 코로나의 여파로 인해 입은 피해가 위 수치에도 드러날 수 있습니다. 앞선 그래프에서도 보실 수 있듯이, 뷔페의 경우 트랜드가 음의 점수를 나타내고 있습니다. 또한, 일식에서 아루히는 리뷰지수와는 반대로 상당히 낮은 리뷰 트랜드 지수를 보입니다. 이 또한 코로나의 영향이라고 추측할 수 있습니다. 추측건대, 아래 사진에서 보듯이 아루히는 사람 사이의 공간이 넓지 않지만 항시 분비는 장소이기에, 최근 고객들에게는 다소 위험한 장소로 인식되었을 수도 있습니다.

 

아루히 네이버예약 페이지 사진

 

3. 가성비 순위  

 

후기 만큼 중요하게 생각하는 부분은 ‘가격’입니다. 여의도 직장인들에게 점심값은 ‘소소익선’입니다. 하지만 열심히 일한 직장인들의 소중한 한 끼기 때문에, 저희는 맛도 잡고 가격도 잡은 식당을 카테고리별로 소개해 드리려고 합니다. 가성비 순위를 보여드리기 전, 데이터를 통해 어떻게 가성비 순위를 산출하게 되었는지에 대한 과정을 보여드리겠습니다. 

 

식당의 가성비는 맛 대비 가격의 저렴함과 비쌈을 의미합니다. 개개인의 차이에 따라 맛의 평가가 달라지지만, SPH 데이터 컨설팅팀에서는 대중의 입맛을 대변하는 ‘리뷰 지수’, 해당 업종의 평균가격, 해당 식당의 평균 가격을 조합하여 새로운 가성비를 정의하고 이에 따른 순위 산출했습니다. 업종별로 가격대의 기준이 다를 수 있음을 인지하여 업종별 가격 차이를 중요 변수로 고려하였습니다. 

 

가성비 산출 프로세스에 따른 가성비 순위 결과  

 

가성비 1위는 각 카테고리별로 진주집, 카레오, 바스버거, 서궁, 그레이에스프레소입니다. 카레오는 일식이지만 주메뉴가 스시가 아니어서 가격이 상대적으로 낮게 측정된 면이 있습니다. 이 점을 감안하면 일식에선, 스시집인 아루히가 가성비가 매우 좋은 것을 확인할 수 있습니다.

 

 

4. 지도로 한 번에 보는 여의도 베스트 식당 현황

앞서 분석한 여의도 맛집의 리뷰 지수, 리뷰 트렌드, 가성비 순위를 구글 my maps에 나타내어 보았습니다. 식당 아이콘을 클릭하시면 식당별 점수와 순위 정보가 나옵니다.


5. 후기

 


Written and Analyzed by 

SPH 데이터 컨설팅 관련 컨설팅 문의는 여기를 클릭해주시기 바랍니다.