데이터 업계 고수와의 인터뷰 01 – 박용재 데이터 분석가님

박용재 데이터 분석가님

 

 

SPH 데이터 컨설팅팀에서 새롭게 선보일 콘텐츠. 바로, 데이터 업계에 계신 선배분들을 찾아뵙고 인터뷰를 진행하는 것인데요! 첫 시작은  GIS United, SK 플래닛, 현대 카드 등을 거쳐 현재 라인 플러스(2013년 설립된 네이버의 자회사로 LINE의 글로벌확장을 함께하고 있는 회사)에서 데이터 분석가로 근무하고 계신 박용재 님입니다. 박용재 님은 첫 직장인 GIS United에서 다년간의 공간 데이터 분석 경험을 쌓으셨습니다. 공간 데이터뿐만 아니라, 커머스를 비롯한 다양한 도메인에서의 데이터 분석 경험을 가진 박용재 님은 말 그대로 데이터 분석계의 10년차 ‘고수’이십니다.

 

감사하게도 박용재 님께서 인터뷰에 응해주셨습니다. 데이터 분석 업계의 선배님을 찾아뵙는 건 이번이 처음이네요. 매우 떨리는 한편, 더 배울 수 있다는 점에서 설렙니다. 

 

저희가 찾아간 곳은 과천에 있는 아늑한 카페입니다. 카페에서 진행하게 된 첫 번째 인터뷰. 박용재 님을 만났습니다. 따뜻하고 선한 미소가 인상적이었습니다. 젊은 얼굴에 벌써 두 아이의 아빠라는 박용재 님. 인터뷰에 대한 사전 답변도 상세히 보내주셨고 인터뷰 내내 친절하고 상냥하게 대해주셔서 정말 감사했습니다. 

 

친절한 선배님과의 인터뷰! 어떻게 진행되었을까요? 차근차근 살펴보시죠!

 

Q. 안녕하세요! 박용재 분석가님. 인터뷰에 응해주셔서 감사합니다. 현재 굴지의 기업에서 데이터 분석가로 활약하고 계시는 데요. 데이터 분석을 전공하신건가요?

A. 안녕하세요. 반갑습니다. 처음에 저는 데이터 분석을 한다는 생각은 하지 못했습니다. 원래 전공은 건축학이었습니다. 우연한 기회로 ‘건축 기획’이란 수업을 듣게 되었습니다. 이 수업에서 지도를 이용한 공간 분석이 포함되어 있었고, 그때 부터 관심을 기울이기 시작했던 것 같습니다. 데이터를 재료로 삼아 시각적으로 인상적인 무언가를 만드는 게 좋았습니다. 하다 보니 이게 데이터 분석이고, 빅데이터고, 데이터 과학이고.. 그런 영역이었습니다. 어떻게 보면 커리어를 우연하게 시작하게 된 것 같습니다.

 

Q. 공간 분석에서 데이터 분석의 첫 발을 디디셨다는 게 흥미롭습니다. 그렇다면 공간 분석에서 더 넓은 분석 분야로 넓히게 된 계기가 있을까요?

A. 공간 분석이 제일 많이 쓰일 거라 예상된 분야는 상권분석이었으나, 위치 정보만으론 한계를 느꼈습니다. 원래는 위치 정보만으로 공간 분석을 진행했죠. 사람들이 공간상에서 비슷한 특징이  있는 곳을 찾아간다는 전제 조건하에 이루어진 분석입니다. 하지만 SNS가 발달한 요즘 시대엔 이 전제가 성립하지 않게 됐어요. 위치상 아주 동떨어진 곳이라도 SNS 정보가 있으면 사람들은 방문합니다. 그렇기에 전통적인 위치 정보만으로 하는 공간 분석에는 한계가 있다고 판단했습니다.

 위치 정보가 유의미하게 쓰일 수 있는 영역은 다양하게 존재하긴 합니다. 가령 교통사고 분석과 같은 곳이죠. 하지만 앞으로 공간 데이터뿐만 아니라, 공간 분석이 메인이 아니라 하나의 부분이 되어서 SNS 데이터를 포함한 다양한 데이터를 추가해서 분석하는 게 필요하다고 생각합니다.

 

Q. 공간 분석에서 더 넓은 분야로 시야를 넓히셨을 때 가장 힘들었던 부분이 있을까요? 

A. 분석의 단위를 ‘공간’에서 벗어나는데 2년이 넘게 걸린 것 같습니다. 분석의 기준을 유저 단위로, 서비스 단위로, 기능 단위로 분석의 기준을 자유롭게 오갈 수 있어야 하는데, 도메인이 무엇이든 ‘공간 단위로 집계하는’ 것을 1순위에 놓는 사고를 유연하게 만드는 게 가장 어려웠습니다. 

 한 편으로는 개인적으로 성장은 스스로 불편한 상황을 편할 때까지 견디는 과정에 있는 거 같다는 생각을 많이 하게 되었습니다. 지금도 새로운 걸 배우면 처음에 너무 와 닿지 않아서 힘든데, 어느 순간 익숙해지고 그 사안에 대해 편하게 말하게 될 때 좀 더 성장했다고 느끼게 됩니다.

 

Q. ‘성장은 스스로 불편한 상황을 편할 때까지 견디는 과정’이라는 말이 와닿습니다. 그렇다면 현재 데이터 분석가로써 하고 계신 직무는 무엇인가요?

A.  현재 라인 플러스에서 서비스 KPI 관리 및 데이터 분석을 맡고 있습니다.

 

Q. 서비스 KPI 관리? 구체적으로 어떤 업무일까요? 

A. 서비스 기획실 소속으로 유저들이 글로벌 메신저 라인의 어떤 서비스를 얼마나 잘 이용하는지, 각 서비스별 성과 지표를 정의하고 분석하는 일 등을 하고 있습니다. 각 서비스 팀의 데이터 엔지니어들과 협업하는 일도 많습니다.

이전에 데이터 분석가로 일했을 때와는 좀 다른 측면도 있습니다. 마케팅, 사업 쪽에서 요청받는 업무에 대해 퍼포먼스를 개선하는 등 이미 진행된 내용에 대해 서포트하는 경우가 많았습니다. 현재는 서비스 기획실에 있다보니 새로운 서비스가 런칭하는 단계부터 협업하면서 분석을 진행하고, KPI 관리 측면에서는 PM 역할로 다른 조직에 협업을 요청하는 일도 종종 있습니다.

 

Q. 현재는 서비스 KPI 관리나 더 넓은 분야의 데이터 분석을 하고 계시는 데, 기회가 되신다면 집중하고 싶은 분석 분야가 있으실까요?

A.  만약 지도와 관련해서 새로운 것을 시도해본다면 지도 제작에 관심이 있습니다. 흔히 말하는 street 레벨의 지도가 아닌, 데이터 분석 결과가 반영된 지도입니다. 분석 결과가 시각화로 지도에 잘 녹여져야겠죠. 지도만 보아도 사람들이 이해하기 쉽고, 각 영역에 맞는 편의를 제공할 수 있는 그런  지도를 만들어보고 싶습니다.

 

Q. 조금은 어려운 질문일 수도 있는데요(웃음). 데이터 분석가(과학자)로서 중요 역량을 다섯 가지로 나누자면 문제 정의, 기술력, 분석력, 해석력, 영향력이 핵심기술이라고 합니다. 혹시 이 중 개인적으로 데이터분석가로서 가장 중요한 역량이 있을까요?

A. 무엇이 더 우선한다는 것은 없을 것 같습니다. 분석가라는 롤은 전방위적으로 계속 확장해나가야 하는 그런 직업 같습니다. 현대 축구의 미드필더 같다는 생각을 많이 합니다. 패스도 웬만큼 해야 하고, 위치선정도 좋아야 하고, 수비도 잘해야 하고, 가끔 골 에어리어 근처에서 결정력도 지녀야 하고요. 다 어느 정도 할 줄은 알아야한다는 점에서 경력이 쌓이더라도 해결해야 할 점이 많다고 생각합니다. 저는 필요한 역량을 꼽아보자면, 문제 정의 + 기술력 + 창의력&모델씽킹 + 커뮤니케이션이라고 생각합니다.

 

Q. 데이터 분석가의 중요 역량에서 ‘문제정의’는 어떤 의미일까요?

A. 분석 프로젝트마다 똑같은 주제일지라도 똑같은 방식으로 풀 수 있는 문제는 하나도 없습니다. 그 케이스에 맞는 해결책을 찾을 수 있게 파고들어야 하는데, 이걸 하려면 일단 ‘잘 들어야’ 했습니다. 거기에 모든 힌트가 다 들어있습니다. 가끔 내가 공부한 머신러닝 모델이나 베스트 케이스를 종착점 삼아 프로젝트 착수를 하는 실수를 할 때도 있는데, 그 모델과 케이스는 내가 풀어야 할 문제와 전혀 맞지 않은 경우가 많았습니다. 결론적으로, 문제 정의는 ‘풀어야 할 문제를 제대로 인지하는 것’이라고 할 수 있습니다.

때로는 도메인 영역에 대한 이해를 간과하면 문제를 제대로 정의하지 못할 수가 있습니다. 11번가에 있을 때 였습니다. 리뷰분석을 해야 했기에, 아마존을 많이 참고했었죠. 하지만 당시 11번가 리뷰는 아마존 리뷰와는 많이 차이가 났습니다. 가장 큰 차이점은 11번가엔 양질의 리뷰 수가 부족하단 것이었습니다. 문제 정의를 달리 해야 했습니다. 현실을 직시해서, 좋은 리뷰어를 발굴하고 좋은 리뷰가 잘 쌓이는 것에도 초점을 맞춰야 했습니다.

 

Q. 도메인 영역에 대한 이해. 간과해서는 안되는 중요한 부분이네요. 그렇다면 요즘 많이 언급되는 딥러닝, 머신러닝 등.. 분석 기술력에 대해서는 어떻게 생각하시나요?

A. 모든 기술을 다 따라잡을 필요는 없지만, 필요한 기술은 지속적으로 습득해야 합니다. 그리고 그 기술이 ‘도구’라고 가볍게 생각해본다면, 굳이 가려서 배울 것이 없습니다. 기술력이 중요한 이유는 ‘속도’를 담보하기 때문입니다. 개인적으로 프로의 기준은 ‘같은 업무의 양과 수준을 제한된 시간 내에 혹은 더 빠르게 할 수 있는 것‘이라고 생각합니다. 다양한 기술에 능하면, 주니어가 2달 걸릴 일을 시니어는 2주 이내에 끝낼 수 있습니다. 더 나은 분석가는 더 높은 수준의 분석을 1주일에 끝낼 수 있을 것이고요. 물론 모든 기술을 다 배워야 한다는 것은 아닙니다. 같은 시간 내에 기술력을 키우는 것과 다른 역량을 키우는 것을 적절히 조절해야 하기 때문입니다. 그래서 기술력을 갖춘다는 것은, 수많은 기술 트렌드 중에 나에게 필요한 것이 무엇인지 골라내는 안목도 포함된다고 생각합니다. 이런 부분은 집중해서 살펴보기보다는, 평소에 심심할 때 구글링해보고 관심 가지는 게 가장 나은 방법인 것 같습니다.

 

Q. 필요 역량으로 언급하신 부분 중 창의력&모델씽킹은 어떻게 보면 가장 어려운 부분일 것 같습니다. 

A. 이 역량은 문제 정의 능력의 연장선일 수 있는데요, 제대로 이해한 내용을 평이하게 풀어내지 않는 것입니다. 그 조건과 문제 특징에 맞게 묘수를(적합한 모델 또는 인사이트) 찾는 것인데, 이 과정을 ‘어떻게 해야 한다’는 것을 정의하기는 쉽지 않은 것 같습니다. 논리적인 근거로 분석해온 과정을 바탕 삼아서, 한 단계를 ‘건너뛰는’ ‘점프하는’ ‘도약하는’ 느낌으로 방안을 제시하는 능력이라고 애매하게 설명할 수 있을듯합니다. 경험상, 화두처럼 한가지 생각과 주제를 풀릴 때까지  ‘곱씹듯이’ 고민을 많이 할수록 좋은 답이 나왔던 것 같습니다. Model Thinking은 내가 풀어나간 방식을 모형화 하는 것입니다. ‘머신러닝 모델’, ‘딥러닝 모델’이 아닌, 전체 프로세스 중 핵심적인 부분을 어떻게 정규화하여 비즈니스 모델 또는 엔지니어링 모듈처럼 다룰 수 있을까 생각해보는 것이 중요하다고 생각합니다.

말씀드린 모든 영역이 다 중요합니다. 그래서 이 부분이 직무에서 좀 도전적인 부분이라고 생각합니다. 그렇지만, 어느 순간이 되면 선택과 집중을 할 필요가 있습니다. 저는 그 과정 중에 있고요.

 

Q. 언급하신 여러 역량 중에 박용재 분석가님이 생각하기에 강점이 부분이 있나요? 

A. 저는 기술력은 앞으로 채워나갈 빈 곳이 많고요^^. 팀 플레이할 때에 아이디어를 많이 내는 편입니다. 비교적 기여를 많이 하는 부분인 것 같습니다. 제가 잘한다고 생각하는 부분이 있다면, 다른 영역의 아이디어를 또 다른 영역에 접목해보는 것이라는 생각이 듭니다. 이런 아이디어나 프레임은 이미 누구나 아는 것이긴 한데, 이 프레임을 다른 데 갖다 대면 완전히 새로운 아이디어가 되는 경우가 있고, 두 가지를 합쳐보면 또 새로운 게 나오고. 설명이 좀 추상적이긴 하지만 그런 경우가 많았습니다. 

 

Q. 위에 말씀하신 역량 중 ‘커뮤니케이션’ 부분에 큰 강점이 있으신 것 같네요. 그렇다면 분석하면서 가장 즐거웠던 순간은 언제일까요?

A. 당연히 가장 즐거웠던 순간은 1) 해결책(포괄적인 의미의 모델)이 떠올랐을 때, 2) 그 해결책에 전체 데이터를 밀어 넣고 그 결과를 봤을 때입니다. 프로세스는 알지만, 그 결과가 어떻게 나올지는 전혀 알 수 없기 때문에, 그 결과는 늘 궁금했던 만큼 신기한 것 같습니다.

 

Q. 반대로 힘들었던 순간도 있으셨을 것 같은데요?

A. 힘들었던 순간은 내가 가진 역량으로 프로젝트를 풀기에 부족하다고 느낄 때인 것 같고, 스트레스(?)받을 때는 성장할 수 없는 프로젝트를 하거나 그런 가능성이 별로 안 보일 때인 것 같아요.

 

Q. 이 질문은 데이터 분석 고수께 꼭 묻고 싶은 질문인데요! 데이터 분석 결과가 원하는 방향으로 나오지 않을 때, 즉 분석 모델 성능이 너무 안 좋다고 판단될 때, 혹은 분석 결과가 원하는 기획 방향대로 나오지 않을 때 어떻게 계획을 재설정하시나요?

A. 기획 방향대로 나오지 않는 것이 정상적인 경우라고 생각합니다. 시나리오, 가설을 생각하고 몰입하다 보면 그 결과가 나오지 않는 것이 이상하다고 여길 때가 있습니다.

 분석의 목적으로 돌아가 보면, 일차적으로 있는 현상을 있는 그대로 인식할 수 있어야 하는 것 같습니다. 예를 들어, ‘서울 주요 상권에서 폐업을 덜 하게 하려면 어떻게 해야 할까’라는 문제를 푼다고 가정할 때, 이 질문의 가정은 ‘폐업을 많이 한다’입니다. 그런데 아무리 데이터를 뜯어봐도 다른 도시에 비해 폐업이 적을 수도 있습니다. 폐업이 많은 것은 통념이거나 나도 모르게 생겨난 인식이었을 수 있습니다. 이럴 때 질문이 잘못되었다고 빠르게 방향 수정을 할 수 있어야 합니다. 글로 읽으면 너무 당연해 보이지만, 제한된 시간에서 내 로직을 놓치기 싫을수록 이런 당연한 것들이 잘 안 보이는 경우도 매우 많았던 것 같습니다.

< 분석 결과물을 어떻게 잘 표현할 수 있을지 실제 지도를 보면서 설명 중>

 

Q. 문제를 있는 현상 그대로 인식하는 것. 정말 좋은 말씀입니다. 박용재 분석가님이 보셨을 때, 현재 분석가로서 더 개발하고 집중하면 좋은 분야가 있을까요?

A. 분석가의 유형은 기능적인 측면에서나 도메인 측면에서나 그 스펙트럼이 매우 넓다고 생각합니다. 개인적으로는 데이터 분석 경험이 어느 정도 누적되었다면, DPM(Data Product Manager) 에 대해 진지하게 생각해볼 필요가 있다고 생각합니다. 

 

Q. DPM?

A. DPM은 분석하는 과정이나 분석을 포괄하는 모듈을 제품처럼 다룰 수 있는 매니저 역할인데, 최근에 제가 회사에서 맡은 일이기도 하고요. 분석은 직접해보면서 겪어보지 않으면 알 수 없는 게 많습니다. 그래서 그런 제품을 만드는 데에도 분석 경험을 풍부히 갖출수록 장점이 많다는 생각이 듭니다. 아직 DPM이라는 단어가 데이터 시장에서는 생소한 편이나, 미국에서는 이제 제법 사용되고 있고, 최근에 카카오에서 직무를 신설해서 채용하는 것도 본 적이 있습니다.

 

Q. 분석가 유형 중에는 DPM을 추천해주셨는 데요. 그렇다면 데이터 분석 내에서 추천할만한 도메인이 있을까요?

A. 어떤 도메인이 유망하다거나 중요하다기보다, 해당 도메인에 대해 자신이 관심 있는 분야인지가 중요하다고 생각합니다. 서비스 관점과 데이터 과학 관점에 따라 데이터셋을 바라보는 게 달라집니다. 데이터 분석가로서 데이터 과학 관점에서 데이터 셋을 바라보기 쉽죠. 가령, 모델러의 입장에선 모델의 성능을 향상시키기 위해 최대한 많은 속성과 특징들을 이용하고 싶을 수 있습니다. 하지만, 속성 정보를 자세히 아는 건 서비스 관점에선 중요하지 않을 수 도 있습니다. 서비스 관점에선 전체 볼륨이 얼마나 되는지를 파악하는 게 더 중요한 경우도 많고요. 다른 조직과 협업할 때 영향력 있는 분석가가 되려면 데이터셋을 서비스 관점에서 바라보는 노력이 중요하다고 생각합니다. 빅데이터라고 다 중요한 게 아니거든요. 데이터 중에서 핵심인 데이터를 찾고, 관련 없는 데이터도 파악할 수 있어야 합니다.

 

Q. 데이터 중 핵심 데이터를 찾는 식견을 기르기 위해서는 지식을 많이 쌓아야 할 것 같네요. 분석가님은 데이터 분석 관련해서 감명 깊게 읽은 책이나 추천할만한 도서가 있으신가요? 또는 자주 참고하는 사이트가 있나요?

A. 저는 데이터 시각화를 좋아해서, 여기저기 둘러보는 편입니다 (프로젝트에서 화려한 시각화할 일은 없지만요) flowingdata.com 사이트를 좋아하고, 이 사이트 운영자가 낸 책 중 visualize this를 좋아합니다. 출간된 지 시간이 많이 지나서 같이 첨부된 R 코드 자체는 매우 basic 합니다. 그리고 NY times 인터랙티브 기사도 좋아합니다.

 ‘모델’을 다룬 책 중에서는 ‘매칭’ (앨빈 로스 지음)을 너무 재밌게 읽었습니다. 장기이식 문제를 풀려면 서로 모르는 사람이 합을 맞춰야 하고, 수술 시간도 제한적이어서 늘 쉽지가 않다고 합니다. 이를 경제학 모델로 풀어내고, 실제로 병원에서 성공해내는 과정을 담은 책입니다.

<박용재 분석가님이 추천하신 도서 ‘매칭’>

 

 

Q. 마지막으로 주니어 데이터 분석가들에게 조언 한 말씀! 부탁드립니다.

A. 첫 회사에선 데이터 분석으로 돈을 벌어야 했습니다. 하지만 SPH는 데이터 분석이 아닌 다른 분야로 이미 수익을 창출하고 있죠. 당장 수익을 창출할만한 프로젝트를 하지 않아도 된다는 여유. 이걸 최대한 활용하셨으면 좋겠습니다. 다양한 시도를 하시는 거죠. 공간 분석에서도 지도뿐만 아니라 이미지 분석, 딥러닝, NLP 등을 접목해보는 것도 좋을 것 같습니다. 

 실제 프로젝트를 하는 거에도 명확한 장점이 있죠. 클라이언트로부터 피드백을 받을 수 있다는 건데요. 이를 위해선 데이터 저널리스트처럼, 페북과 같은 곳에서 공개적으로 피드백을 받는 것도 좋은 선택입니다. 

 데이터 저널에서 중요한 건 신속한 분석입니다. 또한 사람들이 아예 관심 없는 것은 파급력이 없으니 주제를 잘 선정해야겠죠. 그래서 미래의 예정된 이벤트에 대해서 분석하는 걸 추천해 드립니다. 가령 몇 개월 뒤에 예정된 부동산 정책이 있다면, 이 정책 시행되었을 때 발생할 파급 효과에 대한  분석을 미리 해볼 수 있겠네요. 지금부터 미래에 시행될 파급력 있는 정책을 조사하면, 그와 관련된 데이터를 쌓아둘 수 있습니다. 시뮬레이션이나 예측도 할 수 있고요. 그러면 그 정책이 시행된 시기에 신속하게 분석 결과를 공개 할 수 있겠습니다. 

 또한 앞서 말씀드린 DPM에 관심을 가지시면 성장하는 데 큰 도움이 되실 겁니다. 반복되는 프로젝트에서 중요한 부분을 모듈화, 자동화하는 거죠. 단, 여기서 모든 걸 프로덕트화 할 수는 없습니다. 시장의 반응을 보고 프로덕트화할 과정을 선택해야 합니다. 이를 위해선, 분석해왔던 과정이 어떻게 연결되는지 파이프라인 설계를 계속해보시는 게 도움이 됩니다.

 

<좌측부터 SPH 김도환 전임, 박용재 데이터분석가, SPH 이소린 전임>

 

Q. 귀한 시간 내어 주셔서 감사합니다. 

저도 오랜만에 다른 회사분들하고 즐거운 대화도 나누고, 저 스스로도 정리할 수 있는 시간이 된 것 같습니다. ^^

인터뷰를 마치고 …… (한 줄 후기)

*본 인터뷰는 코로나 19 방역에 준수하여 진행하였으며 사진 촬영 시에만 마스크를 내려 촬영하였습니다.

 

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.