데이터 업계 고수와의 인터뷰 04 – 빅스데이터 강승일 이사님

데이터 시각적 분석 전문가

강승일 이사님

 

 데이터 업계의 고수를 찾아 직접 인터뷰하는 컨텐츠! 그 네 번째 고수는 누구일지 기대되는데요! 인터뷰 네 번째 손님은 빅스데이터 회사의 강승일 이사님입니다. 강승일 이사님은 ‘태블로 굿모닝 굿애프터눈’과 ‘데이터 시각적 분석 태블로로 끝내기’ 저자로 활발히 활동하고 계시면서 유튜브 채널 Monday Data Visualization를 운영하고 계십니다. 특히 빅스데이터는 시각화 전문 툴인 Tableau의 파트너사가 되어, 2021년 5월  Tableau 파트너 최고 등급인 Premier Partner가 되었습니다. 2021년부터 Tableau의 최고 파트너사가 된 빅스데이터에서 이사직을 맡고 있는 데이터 시각적 분석 전문가 강승일 이사님과의 인터뷰는 어떻게 진행되었을지 살펴볼까요? 

 

Q. 안녕하세요 이사님! 인터뷰에 응해주셔서 감사합니다. 

안녕하세요! 만나서 반갑습니다.

 

Q. Tableau 시각화 전문가 및 교육자로 활발하게 활동하고 계시는데요! 굴지의 대기업의 프로덕트 매니저에서 데이터 시각화 전문가로 이직하시게된 이유가 있나요?

대기업에서 프로덕트 매니저로 일을 할 때, 서비스 런칭하고서 사용성, 사용자의 트래픽을 확인하기 위해 찾다 보니 Tableau라는 시각화 툴이 눈에 띄었습니다. IT 회사에 있었지만 데이터 관련한 것을 전공하지도 않았고 주로 서비스 기획 및 검색 기획, 커뮤니티 기획과 같은 업무를 했었습니다. 그런 배경에서도 Tableau는 비전공자들도 쉽게 접근할 수 있겠다 싶어서 2016년 Tableau 커뮤니티에 가입하면서 본격적으로 사용하기 시작했습니다.

 

Q. 그럼 Tableau 커뮤니티를 직접적으로 운영하셨던 건가요?

아뇨. 처음에는 멤버로 참여하게 되었구요. 현재는 빅스데이터의 태블로 커뮤니티인 TWBX를 Slack에서 운영하고 있습니다.

 

Q. Tableau 관련 자격증을 많이 보유하고 계시더라구요.

<빅스데이터 사내 인터뷰 모습>

네 (웃음). 2017년 4월에 처음으로 자격증을 땄구요. 데이터 시각화하는 실무부분도 있지만 데이터 커넥션과 같은 이론적인 부분도 공부하면서 좋았습니다. Tableau Desktop Specialist 자격증은 한국에서는 거의 최초로 땄습니다. 

 

Q. 그럼 수많은 시각화 툴 중에 Tableau를 사용하시게 된 계기가 있나요? 

 초반에 말씀드린 것처럼, 직관적이고 쉽다는 게 가장 장점인 것 같아요. 숫자 형태인 측정값을 더블 클릭을 하면 차트 형태로 만들어지고, 세부 형태는 차원이라는 단계에서 조정할 수 있는 것들이 논리적으로 잘 되어있어요. 단순하게 화면으로 예쁘게 표현되는게 아니라, 유저입장에서 어떻게 쓰면 좋을지가 Tableau에 철학적으로 잘 담겨져 있는 것 같아요. 기본적으로 값을 올려주면 막대 차트가 자동으로 나오고, 날짜와 같은 시간 데이터를 나오면 Line 차트로 변경되고.. 이러한 로직이 잘 되어있기때문에 비전공자들도 쉽게 표현할 수 있다는 게 큰 장점인 것 같습니다. 

 

Q. 단순히 데이터 시각화 전문가뿐만 아니라, Tableau 교육자로서도 활발하게 활동하시는데요!

제 성향이, 사람들에게 내가 가진 지식을 공유해주는 것에 행복을 느끼는 것 같아요 (웃음). 또한 책임감있게 하다보니 관련 팀을 만들게 되었습니다. 초반에 Tableau를 검색해서 이용할 때, 그때 당시에는 한국어로 된 책도 전무하고 검색을 하면 거의 영어로 되어있어서 배우기 어려웠습니다. 데이터 관련 비전공자이면서 맨땅에 헤딩을 하다보니 제가 좀 아쉬웠던 부분이라든지 실수했던 부분에서도 노하우가 쌓였고 그런 부분들을 알려드리고 싶었습니다. 

 

Q. 직장인뿐만 아니라 학생들에게도 강의를 하신다고..

네, 요즘 국내 기업에서 Tableau를 이용하는 고객사는 2000여개가 넘습니다. 4~5년전만 하더라도 Tableau를 활용하는 기업이 별로 없었지만, 현재는 많은 회사에서 활용하는 편이라 실무적으로도 취업할 때 경쟁력을 높일 수 있구요. 그런 것들을 교수님들도 잘 알고 계시기때문에 Tableau 강의를 자주 요청하시기도 합니다. 

 

Q. Tech42 리플루언서 및 블로그 등에서 데이터 시각화하신 것들을 공유해주시는데요. 가장 기억에 남는 데이터 시각화가 있으시다면?

아무래도 초반에 성과를 이루었다고 볼 수 있는 작품이었던 ‘초등학교 학생수, 교사수 현황’이 기억에 남아요.  2017년 4월쯤 Tableau 데이터 시각화 경연대회에서, 그때 초등학교 학생수 및 교사수를 이용하여 지도 및 시계열로 표현한 분석 결과가 상을 받았어요. 시각화 뿐만 아니라 분석에서 큰 인사이트를 얻고 발표를 한게 중요했던 것 같아요. 예를들면, 세종시의 경우 계속 학급당 학생수가 상승하고 있고 반대로 대전광역시는 떨어지고 있는 부분들을 소개해드렸어요. 이러한 분석 인사이트를 공유한 부분들이 인정을 받다보니까 데이터 시각적 분석 경력을 전문적으로 쌓아야겠다고 결심을 하게된 것 같습니다. 

<Tableau Viz 대회에서 최우수상을 수상한 전국 초등학교 학생수 & 교사수 현황 대쉬보드>

 

Q.  최근에 하신 것 중에서는 소개해주시고 싶은 데이터 시각화 작품이 있을까요?

 최근에 선보였던 나이키 회사에 관련된 데이터 분석이 있는데요. 나이키는 Digital Transformation을 도입하면서 외부 유통업체의 비중을 줄이고 직접 판매의 비중을 높이고 있습니다. 이유는 외부 유통업체를 통한 판매인 경우에는 고객이 어느 단계에서 진입 후 이탈하는지, 또는 고객이 자사의 제품 구매 이력 관리가 제대로 되지 않았기 때문입니다. 따라서 고객 데이터를 직접 확보하기 위해서 자사 홈페이지 및 앱에서 제품을 직접 판매하는 비중을 늘리기로 합니다. 제가 선보인 시각화는 2016년부터 2020년 사이에 나이키의 직접 판매와 외부 유통 업체 판매 간 이익 비율을 비교했습니다. 아래 시각화 자료를 보시면, 파이차트에 있는 검은색 부분은 직접 판매하여 얻은 이익 부분이고 흰색 부분은 채널을 두어서 판매한 이익에 대한 부분입니다. 보시는 것처럼 2016년부터 점점 직접 판매하여 얻는 이익이 많아지고 있는 것을 볼 수 있습니다. 

<나이키 직접 판매 및 간접 판매 이익 관련 데이터 시각화>

 

Q. 흥미로운 주제네요. 파이차트와 크기로 표현해서 직관적으로 이해하기 쉬운 것 같아요.

 뒷 배경에 나이키 로고를 넣은 이유는 아이스하키 채를 형상화했습니다. 파이차트는 공처럼 보이게 해서 점점 커지고 있다는 것을 직관적으로 보일 수 있게끔 했습니다. 그리고 데이터 시각화는 단순 명료하게 독자들에게 보여지는 것이 중요하기때문에, 색을 많이 쓰지 않고 검은색과 흰색으로 직접 판매와 간접 판매를 대조적으로 표현하였습니다.  

 

Q. 데이터 시각화를 할 때, 주의해야할 점이 있을까요? 

 데이터 시각화는 단순 명료하지 않으면 복잡하고 이해하기 어렵게 변질될 수 있습니다. 많은 걸 넣다보면 결국엔 독자가 이해하기 어려운 결과물이 되구요. 초반엔 여러 색을 쓰고 표현하는 것이 최선이라 생각할 수 있지만 너무 과하지 않게, 심플하게 보여주는 것이 핵심인 것 같습니다. 

 

Q. 데이터 시각화 작품을 많이 게재하셨는데, 시각화 전문가로서 최종 목표가 있을까요?

 누구나 쉽게 접근해서 데이터를 가지고 표현할 수 있는 플랫폼을 만들고 싶습니다. 비전공자도 데이터를 올리고 다운로드받아서 데이터를 시각화하여 인사이트를 얻을 수 있는 전체적인 플로우가 있는 플랫폼이 있는 좋을 것 같아요. 비즈니스적인 측면이 아니더라도, 누구나 데이터를 이해하기 쉽고 시각화하기 쉬운 곳이 있다면 비전공자도 커리어를 쌓을 수 있어서 이점이 있을 것 같구요. 

 

Q. 직접 쓰셨던 ‘데이터 시각적 분석 태블로로 끝내기’라는 책에서 Data Literacy가 중요하다고 언급하셨는데요!

<데이터 시각적 분석 태블로로 끝내기(2021)>

 태블로를 전사적으로 도입하면서 구성원들이 Data Literacy 관점에서 향상되는 것을 많이 경험하게 되었습니다 예전에는 회사 내 데이터를 엑셀로 가공하고 파워포인트나 엑셀로 시각화 했다면, 제가 오랫동안 강의를 하면서 지켜본 회사에서는 Tableau에서 SAP 데이터를 바로 연결 후 Tableau Desktop에서 시각화 후 Tableau Server에 공유를 하니, 최신화되는 데이터를 누구나 쉽게 볼 수 있어서 데이터 기반 의사결정이 빨라져 전반적인 비즈니스에 대한 이해도가 올라가게 되었다고 합니다.     

 

Q. Data Literacy가 중요해지면서 최근 한국 기업에서도 많이 Tableau를 도입하려고 하는데요. Tableau를 교육하실때 경험하신 부분들이 있을까요?

 기술적인 부분과 조직 문화적인 부분이 있을 것 같아요. 기술적인 부분은 아무래도 IT 부서라던지 데이터를 잘 아시는 분들은 어렵지 않게 따라오시지만 영업, 기획 부서들은 비전공자시기때문에 기술적인 부분을 좀 더 쉽게 풀어 설명하려고 노력하구요. 음.. 사실 조직 문화적인 측면이 더 중요하다고 생각해요. 조직 문화적인 측면에서는 회사 경영진분들이 최대한 Tableau를 이해하고 기존 업무를 Tableau로 활용하여 실제 업무에 도입할 수 있게끔 조정해주는 것이 중요한 것 같습니다.    

 

Q. 최근 데이터 분석 및 시각화 업종이 굉장히 인기있는 것으로 보이는데요. 데이터 시각화를 처음 하시거나 이제 막 시작하는 분에게 전문가로써 드리고 싶은 조언 한마디 부탁드립니다. 

 학생들 상대로 강의할 때 자주 언급하는 부분인데요. 첫 번째는 뭐든지 해보는 게 중요한 것 같습니다. 시도를 해보면 본인이 부족한 점이 무엇인지도 알게되구요. 예를들면, 데이터를 어디서 수집하고 처리하는 지에 대해서도 한계를 느끼게되면 자연스럽게 찾아보게 되면서 실력이 늘게 됩니다. 두 번째는, 시작을 했으면 어느 정도 딥다이브(Deep-Dive)를 하는 것이 중요하다고 생각해요. 예전에는 넓게 본 다음에 한 분야를 더 연구하는 것이 좋다고 하지만, 저는 오히려 깊게 공부하고 노력하다보니 관련된 부분들을 더 찾다 보니 capacity가 더 넓어지는 것을 경험하게 되었습니다. 마지막으로, 본인이 직접 만든 데이터 시각화 결과물을 Tableau Public이나, Linkedin 그리고 블로그 등에 본인이 찾은 인사이트를 반영해 공유하는 것을 추천드려요. 다른 사람들로부터 피드백을 받고 그들이 사용하는 환경 및 디바이스를 고려해 업데이트를 한다면 우수한 데이터 시각화로 연결이 될 것 같습니다. 

 

<인플루언서로 활동하시는 Tech 42 일부> 

중요한건, Tableau는 본인 만족을 위해 사용한다기 보다, 이 데이터를 이해하고 보여주고 싶은 사람의 입장의 취향, 성향에 맞춰 만들게 되면서 나름의 노하우가 쌓이고 그것이 전문가가 되는 지름길이 되지 않을까 싶습니다. 

 

데이터 시각화는 본인 만족보다 데이터를 이해하고 보여주고 싶은 사람의 입장으로 만들어가는 것.. 중요한 조언인 것 같습니다. 다시 한번 인터뷰에 응해주셔서 감사합니다. 이상 강승일 이사님과의 인터뷰였습니다!

 

<SPH 김도환 전임, 빅스데이터 강승일 이사, SPH 이소린 전임>

 

인터뷰 후기 한마디!

김도환 

“ 업무를 하며 ‘태블로 굿모닝 애프터눈’ 책의 도움을 많이 받았습니다. 그런 저에게 실제 저자님을 뵐 수 있는 건 정말 좋은 기회였어요. 그리고 데이터 시각화에 있어 상당한 이력과 실력을 갖추고 계심에도 겸손하신 모습이 인상 깊었습니다. 저희를 편하게 만들어주시기도 하셔서 인터뷰가 즐거웠습니다! ”

 

 이소린                        

“ 데이터에 기반한 의사결정의 중요성.. 그리고 간결,명료하게 보여주는 게 중요하다는 것에 크게 공감하였습니다. 

또한 데이터 시각화에 대한 철학적인 의미에 대해서도 들을 수 있어 좋은 시간이었습니다 :) ”

 


*본 인터뷰는 코로나19 방역에 준수하여 진행하였으며 사진 촬영 시에만 마스크를 내려 촬영하였습니다.

 

 

 

SPH는 Google Maps, SuperMap, Maxar Technologies 등 다양한 케이스에 존재하는 다양한 제품군을 보유하고있는 고객의 사례에 꼭 맞는  무료 세미나 및 인적 컨설팅을 제공하고 있습니다. 각 케이스에 더욱 자세한 이야기를 나누고 싶으시다면,  여기 에서 문의 주시길 바라며, SPH에서 발행하는  GIS / 로케이션인텔리전스 관련 최신 소식 을 받아보고 싶으신 분들은  페이스북 페이지  또는  뉴스레터 를 구독 해 주시길 바랍니다. 감사합니다.

데이터 업계 고수와의 인터뷰 03 – 바이브컴퍼니 윤준태 연구소장님

데이터 업계 고수와의 인터뷰 02 – 손진호 연구소장님

손진호 연구소장님

 

데이터 업계의 고수를 찾아 직접 인터뷰하는 컨텐츠! 그 두 번째 고수는 누구일지 기대가 되는데요! 인터뷰 두 번째 손님은 미소정보기술 회사의 손진호 연구소장님이십니다. 미소정보기술 회사는 데이터를 통해 BI 시스템 구축, 의료 정보 분석, 소셜 네트워크 및 텍스트 분석 등 여러 분야에서 왕성한 활동을 하는 빅데이터 전문기업입니다. 11명으로 구성된 작은 회사였을 때부터 145명의 건실한 데이터 전문기업으로 자리매김하는 모든 순간을 함께하신 손진호 연구소장님과의 인터뷰는 어떻게 진행되었을지 살펴보실까요?

 

      Q. 안녕하세요! 소장님. 인터뷰에 응해주셔서 감사합니다. 간단한 자기 소개 부탁드려도 될까요? 

안녕하세요! 만나게 돼서 반갑습니다. 저는 주식회사 클라크라는 국내 지게차 만드는 회사에서 10년 가까이 시스템 기획 등의 업무를 하다가 오래전 미소정보기술로 이직을 하게 되었습니다. 다양한 프로젝트를 20개 이상 진행하면서 실제 필드에서 많은 경험을 하였고 현재 미소정보기술 연구소장을 맡고 있습니다.

 

      Q. 그럼 미소정보기술 회사로 이직을 하신 건 10년 정도 되신거네요? 

그렇죠. 여러 회사 경력은 많지 않지만 한곳에 오래 있는 게 스스로 장점이라고도 생각합니다. (웃음) 그리고 현 회사에서 대기업과의 프로젝트를 많이 하다 보니까 실제 업무 경험을 많이 쌓게 된 것 같습니다. 

 

     Q. 전 회사에서 미소정보기술로 이직을 하게 된 건 어떻게 본다면 완전히 다른 분야로의 이직이라고 볼 수 있을 것 같은데요. 이직을 하실 때 데이터 분석 분야의 이해에 있어서 힘들진 않으셨나요? 

힘들었죠. (웃음) 힘들지만, 한편으론 다른 분야의 도메인을 이해하는 데 큰 발판이 된 것 같습니다. 처음부터 데이터 분석과 같은 분야만 집중했다면 오히려 기업들과의 협업이라던가 프로젝트 진행에 있어서 도메인을 이해하는데 어려웠을 것 같습니다. 반대로 저는 실무를 하고 기획을 했던 경험들이 전혀 데이터에 거부감없이 장점이 됐다고 생각합니다.

 

     Q. 실무 경험이라면? 

타 기업들과 협업을 하게 될 때 기업들의 업무 패턴이나 이런 것들을 전반적으로 이해하고 일을 진행하는 것과 아닌 것의 차이는 크거든요. 그런 부분에서 도메인의 이해에 있어서 큰 충돌이나 어려움이 없었다는 게 장점인 것 같습니다. 

 

     Q. 솔루션 기획, 구축.. 그리고 더해서 인공 지능 분야를 공부하셔야 되는 부분에 있어서는 힘들지 않으셨나요?

이 부분은 매번 말하는 부분인데요. 코딩 레벨이나 스크립트가 가장 중요한 부분이라고는 생각하진 않아요. 데이터 분석을 잘해야 인공지능 모델도 잘 나온다고 생각해요. 데이터 분석을 오래 하고 친숙해지다 보니 인공지능 분야도 빨리 습득하고 업계에서 자리를 잡게 된 것 같습니다.   

   

     Q. 개발 PM 하시면서 20여개의 프로젝트를 도맡아 하셨다고 하셨는데, 가장 인상 깊었던 프로젝트는?

최근에 했던 대형 플랜트 건설사의 개발 요건이 기억에 남네요. 시공을 중심으로 전반적인 플랜트 건설을 맡게 되는 거대 프로젝트인데요. 요건은 이러한 플랜트도 여러 EPC 사의 제안요청서를 받아 가장 좋은 제안을 선택하게 되며 이러한 제안요청서는 PDF 기준으로 파일당 200~400페이지에 달하는 2,000개 이상의 PDF 문서로 전달받게 됩니다. 과거 이를 위해 설계 엔지니어가 한 달 동안 수작업으로 검토하고 분석하여 제안하더라도 1곳만을 선정하니 치열하기도 하고 많은 인력과 비용이 발생하지요. 그런데 문제는 경력자가 사라지면 이러한 노하우나 지식도 사라진다는 거예요. 지식은 사람이 가지고 있고 은퇴나 이직 등 다양한 사유로 다시 시작하고 사라지고 하니, 기업과 지식도 사라진다는 겁니다. 이러한 지식을 담고 제안 요청서를 단기간에 파악할 수 있는 플랫폼을 제안해달라고 하여 연구를 하였고 연구원들과 데이터 분석을 시작, 국내 12개 이상의 기업, 해외 솔루션 대기업 두 군데와 경쟁하여 1차 통과하였으며 마지막에는 해외 대기업들과 경쟁한 끝에 선정된 것이 가장 인상 깊었습니다. 기술도 기술이지만 문제 해결을 위해 치열한 설득과 증명을 한 것이 가장 기억에 남아요.

 

     Q. 쟁쟁한 대기업들과 경쟁에서 이기게 된 노하우가 있을까요? 

꼭 가지고 있는 기술만 제시하고 구축을 하려고 하면 될 수 있는 사례가 많이 없습니다. 도전해야만 만들 수 있고 진행할 수 있는 기회들이 있다고 생각해요. 첨언하자면, 이러한 프로젝트 경험들이 기술 연구소와 결합하면 좋겠다는 생각을 하고 있습니다. 저는 도전적이고 빨리 변화되고 연구개발도 빠르게 순환을 할 수 있게 하는 게 제가 연구소장으로써 추진하는 방향입니다. 

 

     Q. 프로젝트를 진행하실 때 결과적으로 좋은 일도 있지만 갈등도 있을 것 같은데요. 내부, 외부적으로 어떻게 극복하시나요? 

제가 정답은 아니겠지만, 저는 ‘협상’이라고 표현을 합니다. 프로젝트에서는 절대 갑, 절대 을은 없다고 생각해요. 협상해서 합리적인 쪽으로 만들어내면 문제가 없습니다. 하지만 한쪽으로만 고집을 부리게 되면 망하는 케이스가 되는 거라고 생각해요. 서로의 상황을 이해하면서 이루어지는 협상과 협력이 중요합니다.  내부적으로 본다면, 짧은 시간에 완수한다거나 업무 부담과 같은 것들인데요. 회사에는 멘토 제도가 있어서 멘토와 멘티 프로그램으로 서로 문제가 생겼을 때 보완해줄 수 있고 든든한 조력자가 될 수 있기 때문에 업무적 갈등을 최소화할 수 있는 좋은 제도라고 생각해요.

 

     Q. 추가적으로 뜻깊었고 다음에 더욱 개발하고 싶은 프로젝트가 있었나요? 

과거 솔루션 등 가장 뜻깊었던 기억은 메디 허브라는 솔루션입니다. 전 세계에서 발행되는 PUBMED의 정보를 기준으로 MESH TERM이라는 주요 병명과 키워드 간을 분석하고, 의료 논문의 발행 수를 보면서 질병에 대해 한눈에 볼 수 있게 만든 프로그램인데요. 이는 간단하게 의료 연구에 필요하다는 교수님의 의견으로 만들기 시작했습니다. 현재는 미소정보기술 스마트 CDW안에 항상 제공되는 기능으로 소개됩니다. 하지만 이런 부분이 다음에는 공개형으로 환자와 보호자에게 필요한 정보로 제공되면 좋겠습니다. 즉 인공지능 시대에 자동으로 번역되고 새로운 신약의 논문이 어떻게 발행되고 어느 나라에서 관계형 치료나 신약의 관계 등을 알 수 있게 했으면 합니다. 이러한 신약의 정보나 트렌드 정보는 폐쇄적인 것이 큰 문제인데요. 질병을 가지게 되는 환자나 보호자에게는 가장 소중한 시간에 가장 필요한 정보일 수도 있어서 무료로 제공하고 서로 정보를 공유할 수 있는 커뮤니티 정보 App을 만들고 싶네요. 

 

Smart CDW 일부

처: 미소정보기술 웹사이트 (http://www.misoinfo.co.kr/#/misoinfo/solutionDataCdw.do)

 

      Q. 말씀하신 것처럼 개인정보 문제나 이런 제한이 풀리게 되면 하시고 싶은 프로젝트가 있으신가요? 

의료분야는 Closed Domain이지만 다이아몬드와 같은 데이터들이 많다고 생각해요. 이 부분들이 개인정보 문제로 사용될 수 없는 게 안타까운 것 같습니다. 추후에 이런 제한들이 다소 완화된다면 암 발병에 대한 예측과 같은 것들을 인공지능으로 솔루션을 구현하고 싶습니다. 빅데이터를 기반으로 정확도가 더 높아지고 통계적인 접근보다 인공지능 기법으로 질병 예측, 스테이지 관리 같은 것들을 개발했으면 좋을 것 같습니다.

 

     Q.  앞서, 스마트 CDW를 언급하셨는데요. 혹시 의료 분야와 같이 전문 분야를 이해하시고 프로젝트를 진행 하실 때 어려운 점은? 

사실 저는 학부는 컴퓨터 전공, 석사는 물류 시스템, 박사는 공학을 전공했습니다. 다방면으로 공부해서 그런지 다른 도메인 지식을 받아들이는 데 있어서 큰 어려움이 없었던 것 같아요. 금융이나 의료, 제조, 물류 등 베이스적으로 경험을 많이 하게 되면 지식이 폭도 넓어지고 타 분야를 이해하는 데 있어서도 도움이 된다고 생각합니다. 

 

     Q.  2017년 데이터 분석 기법을 활용한 수요예측 모형을 개발하여 서비스 부품 저장위치를 선정하는 논문을 쓰셨는데요. 현재 전자 상거래 웹사이트의 수요 증가와 맞물려 창고 및 허브 관리가 중요시되는 상황에서 서비스 부품이 아닌 상품에 대한 솔루션 개발 계획은 있으신가요? 

요즘에는 리테일이 활발해서 물류가 빨리 배송되는 최적화에도 고민을 많이 하고 있습니다. IBM의 인공지능인 왓슨(Watson), 그리고 One Network의 네오(Neo)등이 물류 공급망 효율을 향상할 수 있게 강화학습을 통한 실시간 의사 결정이 가능한 세상입니다. 과거에는 최적의 위치를 선정하여 작업 효율 개선이나 프로세스 개선을 중심으로 분석했다면, 요즘은 딥러닝의 시대로 강화학습, GAN 등을 통한 예측 방식이 발전되었는데요. 미소정보기술 연구소도 강화학습기반의 풀필먼트 수요 예측 시스템을 준비하고 있습니다. 일반적으로 Markov Decision Process에서 정의된 각 상태(state)의 이전(Transition)에서 행동에 대한 보상을 최대화하는 방향으로 학습하고, 주어진 상태를 바탕으로 Agent는 action을 취하며 action이 environment의 입력으로 새로운 state와 reward를 반환하여 수요예측의 강화 효과가 있고요. 이는 SCM망의 재고 효율화에 강화학습을 통한 풀필먼트 수요 예측반영을 통한 SCM 망내의 풀필먼트가 진행되는 재고의 효율화 강화에 집중하면서, 보다 확장적인 인공지능 기반의 수요예측 시뮬레이션 플랫폼 개발을 목적으로 합니다.

 

     Q.  텍스트 분석, 버즈 분석과같은 솔루션도 개발을 하셨더라구요.

맞습니다. 딱히 수주가 있어서 시작한 솔루션은 아닙니다. 버즈 분석과 같은 솔루션을 개발한 건 빅데이터를 하는 상징성도 있었습니다. 텍스트 데이터를 수집하다보면 트렌드를 볼 수 있고 비슷한 추세로 따라가는 것도 볼 수 있습니다. 현재 미소정보기술에서는 15억 건 이상의 데이터를 운용하고 있고 매일 10만~ 20만 건 정도 수집하면서 정제 및 학습 데이터까지 만들고 있는 업무를 하고 있습니다. 다년간의 경험으로 최적화도 가능해져서 현재는 큰 부담 없이 빅데이터 수집, 정제, 저장에 저희만의 노하우가 생겼습니다. 

 

     Q.  요즘에는 이미지 관련한 인공지능도 많이 바이럴되고 있는데요. 혹시 인공지능이 결합된 이미지 합성과 같은 솔루션도 진행 중인게 있나요? 

사실 이미지 분석은 그전까지는 원천기술이 충분하지 않았고 시스템화시키기에는 아직 이르다고 판단했었는데요. 마침 올해는 트렌드도 맞는 것 같아서 사업에 진행 중에 있는데 학습 데이터를 만들고 학습시키고 분류 판단하는 솔루션을 상반기에 스마트 AL이라는 이름으로 출시될 예정입니다. 


Q. 굉장히 많은 분야에서 개발이 진행되고 있네요. 그렇다면 미래에는 이 업계에서 어떠한 일들을 해나가고 싶은지 여쭤봐도 될까요?

저는 인공지능 쪽에 계속 연구를 하고 싶어요. 이번에 가장 똑똑한 가상 비서를 만드는 프로젝트도 맡게 되었는데요. 제조기업의 가상 비서를 만드는데, 정보를 빨리 찾아서 “이 시간에 교통량이 어때?”라고 할 때 자체적으로 검색해주고 실질적인 정보를 주는 가상비서를 만드는게 목표입니다. 기업과 기관에 들어가게 돼서 이러한 전문화된 비서들이 활동을 하면 업무적으로나 여러 면에서 편해지지 않을까 싶습니다. 사람들이 ‘아이언맨’의 자비스를 보면서 나만의 가상비서가 있으면 너무 좋겠다라고 생각하시는데요. 저는 이러한 ‘나만의 전문화된 가상비서’를 만드는게 5년~10년 안에 만드는 게 저의 목표입니다.  

 

제조현장 특화 인공지능 비서 

출처: 미소정보기술 웹사이트 (http://www.misoinfo.co.kr/#/misoinfo/viewPrNewsDetail.do)

 

     Q. 마지막으로 데이터 업계에서 선두주자로 있으시면서 요즘 데이터 업계쪽으로 관심있으신 분들에게 해주실 조언이나 한말씀 부탁드리겠습니다.  

저는 IT 전문 서적보다는 TED라는 책을 꼭 읽어보시라고 추천해 드리고 싶어요. 유명한 교수나 IT 전문가들이 어떻게 발표하는지 보셨으면 좋겠어요. 새롭게 진입하시는 분들이 자기표현을 잘하셨으면 좋겠는데, 내가 이러한 프로그램을 짰고 Tensor에서 증명했고, 인공지능을 알고 있다는 전반적인 것들을 표현할 수 있다면 큰 장점이며 빨리 성장할 수 있다고 생각해요. 표현력. 그게 가장 큰 무기라고 생각합니다. 

 

 

<우측 손진호 연구소장님, 좌측 SPH 이소린 전임> 

 

‘내가 가진 지식과 기술을 다른 사람들에게 올바르게 표현할 수 있어야 한다’라는 말이 와닿네요. 특히나 마지막에 말씀하신 ‘나에게 특화된 인공지능 비서’는 일반인들에게도 공개되어 많은 사람들에게도 큰 도움이 되는 인공지능 기술이되면 좋겠습니다. 바쁜 와중에 시간 내주셔서 감사합니다. 이상 손진호 연구소장님과의 인터뷰였습니다!

    

 

*본 인터뷰는 코로나19 방역에 준수하여 진행하였으며 사진 촬영 시에만 마스크를 내려 촬영하였습니다.

데이터 업계 고수와의 인터뷰 01 – 박용재 데이터 분석가님

박용재 데이터 분석가님

 

 

SPH 데이터 컨설팅팀에서 새롭게 선보일 콘텐츠. 바로, 데이터 업계에 계신 선배분들을 찾아뵙고 인터뷰를 진행하는 것인데요! 첫 시작은  GIS United, SK 플래닛, 현대 카드 등을 거쳐 현재 라인 플러스(2013년 설립된 네이버의 자회사로 LINE의 글로벌확장을 함께하고 있는 회사)에서 데이터 분석가로 근무하고 계신 박용재 님입니다. 박용재 님은 첫 직장인 GIS United에서 다년간의 공간 데이터 분석 경험을 쌓으셨습니다. 공간 데이터뿐만 아니라, 커머스를 비롯한 다양한 도메인에서의 데이터 분석 경험을 가진 박용재 님은 말 그대로 데이터 분석계의 10년차 ‘고수’이십니다.

 

감사하게도 박용재 님께서 인터뷰에 응해주셨습니다. 데이터 분석 업계의 선배님을 찾아뵙는 건 이번이 처음이네요. 매우 떨리는 한편, 더 배울 수 있다는 점에서 설렙니다. 

 

저희가 찾아간 곳은 과천에 있는 아늑한 카페입니다. 카페에서 진행하게 된 첫 번째 인터뷰. 박용재 님을 만났습니다. 따뜻하고 선한 미소가 인상적이었습니다. 젊은 얼굴에 벌써 두 아이의 아빠라는 박용재 님. 인터뷰에 대한 사전 답변도 상세히 보내주셨고 인터뷰 내내 친절하고 상냥하게 대해주셔서 정말 감사했습니다. 

 

친절한 선배님과의 인터뷰! 어떻게 진행되었을까요? 차근차근 살펴보시죠!

 

Q. 안녕하세요! 박용재 분석가님. 인터뷰에 응해주셔서 감사합니다. 현재 굴지의 기업에서 데이터 분석가로 활약하고 계시는 데요. 데이터 분석을 전공하신건가요?

A. 안녕하세요. 반갑습니다. 처음에 저는 데이터 분석을 한다는 생각은 하지 못했습니다. 원래 전공은 건축학이었습니다. 우연한 기회로 ‘건축 기획’이란 수업을 듣게 되었습니다. 이 수업에서 지도를 이용한 공간 분석이 포함되어 있었고, 그때 부터 관심을 기울이기 시작했던 것 같습니다. 데이터를 재료로 삼아 시각적으로 인상적인 무언가를 만드는 게 좋았습니다. 하다 보니 이게 데이터 분석이고, 빅데이터고, 데이터 과학이고.. 그런 영역이었습니다. 어떻게 보면 커리어를 우연하게 시작하게 된 것 같습니다.

 

Q. 공간 분석에서 데이터 분석의 첫 발을 디디셨다는 게 흥미롭습니다. 그렇다면 공간 분석에서 더 넓은 분석 분야로 넓히게 된 계기가 있을까요?

A. 공간 분석이 제일 많이 쓰일 거라 예상된 분야는 상권분석이었으나, 위치 정보만으론 한계를 느꼈습니다. 원래는 위치 정보만으로 공간 분석을 진행했죠. 사람들이 공간상에서 비슷한 특징이  있는 곳을 찾아간다는 전제 조건하에 이루어진 분석입니다. 하지만 SNS가 발달한 요즘 시대엔 이 전제가 성립하지 않게 됐어요. 위치상 아주 동떨어진 곳이라도 SNS 정보가 있으면 사람들은 방문합니다. 그렇기에 전통적인 위치 정보만으로 하는 공간 분석에는 한계가 있다고 판단했습니다.

 위치 정보가 유의미하게 쓰일 수 있는 영역은 다양하게 존재하긴 합니다. 가령 교통사고 분석과 같은 곳이죠. 하지만 앞으로 공간 데이터뿐만 아니라, 공간 분석이 메인이 아니라 하나의 부분이 되어서 SNS 데이터를 포함한 다양한 데이터를 추가해서 분석하는 게 필요하다고 생각합니다.

 

Q. 공간 분석에서 더 넓은 분야로 시야를 넓히셨을 때 가장 힘들었던 부분이 있을까요? 

A. 분석의 단위를 ‘공간’에서 벗어나는데 2년이 넘게 걸린 것 같습니다. 분석의 기준을 유저 단위로, 서비스 단위로, 기능 단위로 분석의 기준을 자유롭게 오갈 수 있어야 하는데, 도메인이 무엇이든 ‘공간 단위로 집계하는’ 것을 1순위에 놓는 사고를 유연하게 만드는 게 가장 어려웠습니다. 

 한 편으로는 개인적으로 성장은 스스로 불편한 상황을 편할 때까지 견디는 과정에 있는 거 같다는 생각을 많이 하게 되었습니다. 지금도 새로운 걸 배우면 처음에 너무 와 닿지 않아서 힘든데, 어느 순간 익숙해지고 그 사안에 대해 편하게 말하게 될 때 좀 더 성장했다고 느끼게 됩니다.

 

Q. ‘성장은 스스로 불편한 상황을 편할 때까지 견디는 과정’이라는 말이 와닿습니다. 그렇다면 현재 데이터 분석가로써 하고 계신 직무는 무엇인가요?

A.  현재 라인 플러스에서 서비스 KPI 관리 및 데이터 분석을 맡고 있습니다.

 

Q. 서비스 KPI 관리? 구체적으로 어떤 업무일까요? 

A. 서비스 기획실 소속으로 유저들이 글로벌 메신저 라인의 어떤 서비스를 얼마나 잘 이용하는지, 각 서비스별 성과 지표를 정의하고 분석하는 일 등을 하고 있습니다. 각 서비스 팀의 데이터 엔지니어들과 협업하는 일도 많습니다.

이전에 데이터 분석가로 일했을 때와는 좀 다른 측면도 있습니다. 마케팅, 사업 쪽에서 요청받는 업무에 대해 퍼포먼스를 개선하는 등 이미 진행된 내용에 대해 서포트하는 경우가 많았습니다. 현재는 서비스 기획실에 있다보니 새로운 서비스가 런칭하는 단계부터 협업하면서 분석을 진행하고, KPI 관리 측면에서는 PM 역할로 다른 조직에 협업을 요청하는 일도 종종 있습니다.

 

Q. 현재는 서비스 KPI 관리나 더 넓은 분야의 데이터 분석을 하고 계시는 데, 기회가 되신다면 집중하고 싶은 분석 분야가 있으실까요?

A.  만약 지도와 관련해서 새로운 것을 시도해본다면 지도 제작에 관심이 있습니다. 흔히 말하는 street 레벨의 지도가 아닌, 데이터 분석 결과가 반영된 지도입니다. 분석 결과가 시각화로 지도에 잘 녹여져야겠죠. 지도만 보아도 사람들이 이해하기 쉽고, 각 영역에 맞는 편의를 제공할 수 있는 그런  지도를 만들어보고 싶습니다.

 

Q. 조금은 어려운 질문일 수도 있는데요(웃음). 데이터 분석가(과학자)로서 중요 역량을 다섯 가지로 나누자면 문제 정의, 기술력, 분석력, 해석력, 영향력이 핵심기술이라고 합니다. 혹시 이 중 개인적으로 데이터분석가로서 가장 중요한 역량이 있을까요?

A. 무엇이 더 우선한다는 것은 없을 것 같습니다. 분석가라는 롤은 전방위적으로 계속 확장해나가야 하는 그런 직업 같습니다. 현대 축구의 미드필더 같다는 생각을 많이 합니다. 패스도 웬만큼 해야 하고, 위치선정도 좋아야 하고, 수비도 잘해야 하고, 가끔 골 에어리어 근처에서 결정력도 지녀야 하고요. 다 어느 정도 할 줄은 알아야한다는 점에서 경력이 쌓이더라도 해결해야 할 점이 많다고 생각합니다. 저는 필요한 역량을 꼽아보자면, 문제 정의 + 기술력 + 창의력&모델씽킹 + 커뮤니케이션이라고 생각합니다.

 

Q. 데이터 분석가의 중요 역량에서 ‘문제정의’는 어떤 의미일까요?

A. 분석 프로젝트마다 똑같은 주제일지라도 똑같은 방식으로 풀 수 있는 문제는 하나도 없습니다. 그 케이스에 맞는 해결책을 찾을 수 있게 파고들어야 하는데, 이걸 하려면 일단 ‘잘 들어야’ 했습니다. 거기에 모든 힌트가 다 들어있습니다. 가끔 내가 공부한 머신러닝 모델이나 베스트 케이스를 종착점 삼아 프로젝트 착수를 하는 실수를 할 때도 있는데, 그 모델과 케이스는 내가 풀어야 할 문제와 전혀 맞지 않은 경우가 많았습니다. 결론적으로, 문제 정의는 ‘풀어야 할 문제를 제대로 인지하는 것’이라고 할 수 있습니다.

때로는 도메인 영역에 대한 이해를 간과하면 문제를 제대로 정의하지 못할 수가 있습니다. 11번가에 있을 때 였습니다. 리뷰분석을 해야 했기에, 아마존을 많이 참고했었죠. 하지만 당시 11번가 리뷰는 아마존 리뷰와는 많이 차이가 났습니다. 가장 큰 차이점은 11번가엔 양질의 리뷰 수가 부족하단 것이었습니다. 문제 정의를 달리 해야 했습니다. 현실을 직시해서, 좋은 리뷰어를 발굴하고 좋은 리뷰가 잘 쌓이는 것에도 초점을 맞춰야 했습니다.

 

Q. 도메인 영역에 대한 이해. 간과해서는 안되는 중요한 부분이네요. 그렇다면 요즘 많이 언급되는 딥러닝, 머신러닝 등.. 분석 기술력에 대해서는 어떻게 생각하시나요?

A. 모든 기술을 다 따라잡을 필요는 없지만, 필요한 기술은 지속적으로 습득해야 합니다. 그리고 그 기술이 ‘도구’라고 가볍게 생각해본다면, 굳이 가려서 배울 것이 없습니다. 기술력이 중요한 이유는 ‘속도’를 담보하기 때문입니다. 개인적으로 프로의 기준은 ‘같은 업무의 양과 수준을 제한된 시간 내에 혹은 더 빠르게 할 수 있는 것‘이라고 생각합니다. 다양한 기술에 능하면, 주니어가 2달 걸릴 일을 시니어는 2주 이내에 끝낼 수 있습니다. 더 나은 분석가는 더 높은 수준의 분석을 1주일에 끝낼 수 있을 것이고요. 물론 모든 기술을 다 배워야 한다는 것은 아닙니다. 같은 시간 내에 기술력을 키우는 것과 다른 역량을 키우는 것을 적절히 조절해야 하기 때문입니다. 그래서 기술력을 갖춘다는 것은, 수많은 기술 트렌드 중에 나에게 필요한 것이 무엇인지 골라내는 안목도 포함된다고 생각합니다. 이런 부분은 집중해서 살펴보기보다는, 평소에 심심할 때 구글링해보고 관심 가지는 게 가장 나은 방법인 것 같습니다.

 

Q. 필요 역량으로 언급하신 부분 중 창의력&모델씽킹은 어떻게 보면 가장 어려운 부분일 것 같습니다. 

A. 이 역량은 문제 정의 능력의 연장선일 수 있는데요, 제대로 이해한 내용을 평이하게 풀어내지 않는 것입니다. 그 조건과 문제 특징에 맞게 묘수를(적합한 모델 또는 인사이트) 찾는 것인데, 이 과정을 ‘어떻게 해야 한다’는 것을 정의하기는 쉽지 않은 것 같습니다. 논리적인 근거로 분석해온 과정을 바탕 삼아서, 한 단계를 ‘건너뛰는’ ‘점프하는’ ‘도약하는’ 느낌으로 방안을 제시하는 능력이라고 애매하게 설명할 수 있을듯합니다. 경험상, 화두처럼 한가지 생각과 주제를 풀릴 때까지  ‘곱씹듯이’ 고민을 많이 할수록 좋은 답이 나왔던 것 같습니다. Model Thinking은 내가 풀어나간 방식을 모형화 하는 것입니다. ‘머신러닝 모델’, ‘딥러닝 모델’이 아닌, 전체 프로세스 중 핵심적인 부분을 어떻게 정규화하여 비즈니스 모델 또는 엔지니어링 모듈처럼 다룰 수 있을까 생각해보는 것이 중요하다고 생각합니다.

말씀드린 모든 영역이 다 중요합니다. 그래서 이 부분이 직무에서 좀 도전적인 부분이라고 생각합니다. 그렇지만, 어느 순간이 되면 선택과 집중을 할 필요가 있습니다. 저는 그 과정 중에 있고요.

 

Q. 언급하신 여러 역량 중에 박용재 분석가님이 생각하기에 강점이 부분이 있나요? 

A. 저는 기술력은 앞으로 채워나갈 빈 곳이 많고요^^. 팀 플레이할 때에 아이디어를 많이 내는 편입니다. 비교적 기여를 많이 하는 부분인 것 같습니다. 제가 잘한다고 생각하는 부분이 있다면, 다른 영역의 아이디어를 또 다른 영역에 접목해보는 것이라는 생각이 듭니다. 이런 아이디어나 프레임은 이미 누구나 아는 것이긴 한데, 이 프레임을 다른 데 갖다 대면 완전히 새로운 아이디어가 되는 경우가 있고, 두 가지를 합쳐보면 또 새로운 게 나오고. 설명이 좀 추상적이긴 하지만 그런 경우가 많았습니다. 

 

Q. 위에 말씀하신 역량 중 ‘커뮤니케이션’ 부분에 큰 강점이 있으신 것 같네요. 그렇다면 분석하면서 가장 즐거웠던 순간은 언제일까요?

A. 당연히 가장 즐거웠던 순간은 1) 해결책(포괄적인 의미의 모델)이 떠올랐을 때, 2) 그 해결책에 전체 데이터를 밀어 넣고 그 결과를 봤을 때입니다. 프로세스는 알지만, 그 결과가 어떻게 나올지는 전혀 알 수 없기 때문에, 그 결과는 늘 궁금했던 만큼 신기한 것 같습니다.

 

Q. 반대로 힘들었던 순간도 있으셨을 것 같은데요?

A. 힘들었던 순간은 내가 가진 역량으로 프로젝트를 풀기에 부족하다고 느낄 때인 것 같고, 스트레스(?)받을 때는 성장할 수 없는 프로젝트를 하거나 그런 가능성이 별로 안 보일 때인 것 같아요.

 

Q. 이 질문은 데이터 분석 고수께 꼭 묻고 싶은 질문인데요! 데이터 분석 결과가 원하는 방향으로 나오지 않을 때, 즉 분석 모델 성능이 너무 안 좋다고 판단될 때, 혹은 분석 결과가 원하는 기획 방향대로 나오지 않을 때 어떻게 계획을 재설정하시나요?

A. 기획 방향대로 나오지 않는 것이 정상적인 경우라고 생각합니다. 시나리오, 가설을 생각하고 몰입하다 보면 그 결과가 나오지 않는 것이 이상하다고 여길 때가 있습니다.

 분석의 목적으로 돌아가 보면, 일차적으로 있는 현상을 있는 그대로 인식할 수 있어야 하는 것 같습니다. 예를 들어, ‘서울 주요 상권에서 폐업을 덜 하게 하려면 어떻게 해야 할까’라는 문제를 푼다고 가정할 때, 이 질문의 가정은 ‘폐업을 많이 한다’입니다. 그런데 아무리 데이터를 뜯어봐도 다른 도시에 비해 폐업이 적을 수도 있습니다. 폐업이 많은 것은 통념이거나 나도 모르게 생겨난 인식이었을 수 있습니다. 이럴 때 질문이 잘못되었다고 빠르게 방향 수정을 할 수 있어야 합니다. 글로 읽으면 너무 당연해 보이지만, 제한된 시간에서 내 로직을 놓치기 싫을수록 이런 당연한 것들이 잘 안 보이는 경우도 매우 많았던 것 같습니다.

< 분석 결과물을 어떻게 잘 표현할 수 있을지 실제 지도를 보면서 설명 중>

 

Q. 문제를 있는 현상 그대로 인식하는 것. 정말 좋은 말씀입니다. 박용재 분석가님이 보셨을 때, 현재 분석가로서 더 개발하고 집중하면 좋은 분야가 있을까요?

A. 분석가의 유형은 기능적인 측면에서나 도메인 측면에서나 그 스펙트럼이 매우 넓다고 생각합니다. 개인적으로는 데이터 분석 경험이 어느 정도 누적되었다면, DPM(Data Product Manager) 에 대해 진지하게 생각해볼 필요가 있다고 생각합니다. 

 

Q. DPM?

A. DPM은 분석하는 과정이나 분석을 포괄하는 모듈을 제품처럼 다룰 수 있는 매니저 역할인데, 최근에 제가 회사에서 맡은 일이기도 하고요. 분석은 직접해보면서 겪어보지 않으면 알 수 없는 게 많습니다. 그래서 그런 제품을 만드는 데에도 분석 경험을 풍부히 갖출수록 장점이 많다는 생각이 듭니다. 아직 DPM이라는 단어가 데이터 시장에서는 생소한 편이나, 미국에서는 이제 제법 사용되고 있고, 최근에 카카오에서 직무를 신설해서 채용하는 것도 본 적이 있습니다.

 

Q. 분석가 유형 중에는 DPM을 추천해주셨는 데요. 그렇다면 데이터 분석 내에서 추천할만한 도메인이 있을까요?

A. 어떤 도메인이 유망하다거나 중요하다기보다, 해당 도메인에 대해 자신이 관심 있는 분야인지가 중요하다고 생각합니다. 서비스 관점과 데이터 과학 관점에 따라 데이터셋을 바라보는 게 달라집니다. 데이터 분석가로서 데이터 과학 관점에서 데이터 셋을 바라보기 쉽죠. 가령, 모델러의 입장에선 모델의 성능을 향상시키기 위해 최대한 많은 속성과 특징들을 이용하고 싶을 수 있습니다. 하지만, 속성 정보를 자세히 아는 건 서비스 관점에선 중요하지 않을 수 도 있습니다. 서비스 관점에선 전체 볼륨이 얼마나 되는지를 파악하는 게 더 중요한 경우도 많고요. 다른 조직과 협업할 때 영향력 있는 분석가가 되려면 데이터셋을 서비스 관점에서 바라보는 노력이 중요하다고 생각합니다. 빅데이터라고 다 중요한 게 아니거든요. 데이터 중에서 핵심인 데이터를 찾고, 관련 없는 데이터도 파악할 수 있어야 합니다.

 

Q. 데이터 중 핵심 데이터를 찾는 식견을 기르기 위해서는 지식을 많이 쌓아야 할 것 같네요. 분석가님은 데이터 분석 관련해서 감명 깊게 읽은 책이나 추천할만한 도서가 있으신가요? 또는 자주 참고하는 사이트가 있나요?

A. 저는 데이터 시각화를 좋아해서, 여기저기 둘러보는 편입니다 (프로젝트에서 화려한 시각화할 일은 없지만요) flowingdata.com 사이트를 좋아하고, 이 사이트 운영자가 낸 책 중 visualize this를 좋아합니다. 출간된 지 시간이 많이 지나서 같이 첨부된 R 코드 자체는 매우 basic 합니다. 그리고 NY times 인터랙티브 기사도 좋아합니다.

 ‘모델’을 다룬 책 중에서는 ‘매칭’ (앨빈 로스 지음)을 너무 재밌게 읽었습니다. 장기이식 문제를 풀려면 서로 모르는 사람이 합을 맞춰야 하고, 수술 시간도 제한적이어서 늘 쉽지가 않다고 합니다. 이를 경제학 모델로 풀어내고, 실제로 병원에서 성공해내는 과정을 담은 책입니다.

<박용재 분석가님이 추천하신 도서 ‘매칭’>

 

 

Q. 마지막으로 주니어 데이터 분석가들에게 조언 한 말씀! 부탁드립니다.

A. 첫 회사에선 데이터 분석으로 돈을 벌어야 했습니다. 하지만 SPH는 데이터 분석이 아닌 다른 분야로 이미 수익을 창출하고 있죠. 당장 수익을 창출할만한 프로젝트를 하지 않아도 된다는 여유. 이걸 최대한 활용하셨으면 좋겠습니다. 다양한 시도를 하시는 거죠. 공간 분석에서도 지도뿐만 아니라 이미지 분석, 딥러닝, NLP 등을 접목해보는 것도 좋을 것 같습니다. 

 실제 프로젝트를 하는 거에도 명확한 장점이 있죠. 클라이언트로부터 피드백을 받을 수 있다는 건데요. 이를 위해선 데이터 저널리스트처럼, 페북과 같은 곳에서 공개적으로 피드백을 받는 것도 좋은 선택입니다. 

 데이터 저널에서 중요한 건 신속한 분석입니다. 또한 사람들이 아예 관심 없는 것은 파급력이 없으니 주제를 잘 선정해야겠죠. 그래서 미래의 예정된 이벤트에 대해서 분석하는 걸 추천해 드립니다. 가령 몇 개월 뒤에 예정된 부동산 정책이 있다면, 이 정책 시행되었을 때 발생할 파급 효과에 대한  분석을 미리 해볼 수 있겠네요. 지금부터 미래에 시행될 파급력 있는 정책을 조사하면, 그와 관련된 데이터를 쌓아둘 수 있습니다. 시뮬레이션이나 예측도 할 수 있고요. 그러면 그 정책이 시행된 시기에 신속하게 분석 결과를 공개 할 수 있겠습니다. 

 또한 앞서 말씀드린 DPM에 관심을 가지시면 성장하는 데 큰 도움이 되실 겁니다. 반복되는 프로젝트에서 중요한 부분을 모듈화, 자동화하는 거죠. 단, 여기서 모든 걸 프로덕트화 할 수는 없습니다. 시장의 반응을 보고 프로덕트화할 과정을 선택해야 합니다. 이를 위해선, 분석해왔던 과정이 어떻게 연결되는지 파이프라인 설계를 계속해보시는 게 도움이 됩니다.

 

<좌측부터 SPH 김도환 전임, 박용재 데이터분석가, SPH 이소린 전임>

 

Q. 귀한 시간 내어 주셔서 감사합니다. 

저도 오랜만에 다른 회사분들하고 즐거운 대화도 나누고, 저 스스로도 정리할 수 있는 시간이 된 것 같습니다. ^^

인터뷰를 마치고 …… (한 줄 후기)

*본 인터뷰는 코로나 19 방역에 준수하여 진행하였으며 사진 촬영 시에만 마스크를 내려 촬영하였습니다.

 

SPH는 CARTO, Google Maps, SuperMap 등 다양한 케이스에 적용될 수 있는 다채로운 제품군을 보유하고 있으며 고객의 사례에 꼭 맞는 무료 세미나 및 개별 컨설팅을 제공하고 있습니다. 각 케이스에 맞춰 더욱 자세한 이야기를 나누고 싶으시다면 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS/로케이션 인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해 주시길 바랍니다. 감사합니다.