상단여백
HOME 칼럼 김형중의 핀테크
탄핵 과정에서의 스몰 데이터

[한국뉴스투데이] 박근혜 대통령의 탄핵이 234표 찬성으로 가결됐다. 통치자의 탄핵은 국가적으로 슬픈 일이다. 대통령과 국민 모두에게 불행한 일이다. 이번 탄핵에 이르는 과정에서 여러 정보들이 수집되고 꼼꼼히 분석됐다. 그러면서 스몰 데이터가 진가를 발휘했다.

스몰 데이터 전도사인 마틴 린드스트롬은 사소한 징후들로부터 예측한 거대한 트렌드들을 모아 책을 냈다. 그 책 제목이 바로 “스몰 데이터”다.

빅데이터가 상관관계 찾기에 집중할 때 스몰 데이터는 인과관계 찾기에 집중한다고 린드스트롬은 강조한다.

박근혜 대통령 탄핵의 결정적인 출발점은 JTBC가 확보한 태블릿PC였고, 최순실의 위세를 밝힌 것은 TV조선이 확보한 CCTV 동영상이었다. 그 전에 한겨레는 엄청 발품을 팔아 K스포츠재단 이사장이 최순실의 단골 마사지 센터장이라는 것을 알아냈다.

법률 미꾸라지라 불렸던 김기춘 비서실장이 최순실을 모른다고 딱 잡아뗐지만 그 거짓말을 반박한 동영상 자료는 주식갤러리에서 제보됐다. 박근혜 대통령이 도대체 누구를 만나는지 모든 국민이 궁금해 했는데 한 요리사의 증언으로 혼밥한다는 사실이 알려졌다.

제왕적 권력을 쥔 대통령 주변에서 벌어진 국정농단의 퍼즐을 맞추는 게 쉽지 않았다. 그런데 그 단서는 사소한 제보 몇 개로부터 나왔다. 집념에 찬 끈질긴 분석의 힘이기도 하다. 이번 탄핵의 핵심 정보들은 대부분 민초들이 제공했다. 이게 바로 스몰 데이터의 힘이다. 그것들 사이에는 어떤 상관관계도 없어 보였다. 그저 파편 같은 것들이었다.

닉슨 대통령의 탄핵도 스몰 데이터로부터 시작되었다. 워터게이트 호텔의 경비원이 괴한의 침입 흔적을 감지하고 경찰에 신고했다. 지극히 사소한 일로 치부될 수도 있었다.

출동한 경찰이 도청장치를 설치하려던 괴한 5명을 체포했는데 그들은 끝까지 단순절도범임을 주장했다. 그런데 그들을 돕기 위해 나타난 변호사가 필요 이상의 거물급이었다. 의외였고 뭔가 수상했다.

그렇지만 이 사건은 세상의 이목을 끌지 못하고 조용히 묻힐 뻔했다. 닉슨이 재선에 성공했고 그에게는 다시 막강한 권력이 쥐어졌다. 그런데 TV로 전국에 생중계되는 청문회에서 그의 보좌관이 백악관 대통령 집무실에는 모든 대화를 녹음하는 비밀장치가 있으며, 닉슨이 그 사건의 은폐 공작에 관여한 내용도 녹음되어 있다고 증언했다. 이후 닉슨은 특별검사 목을 날리는 등 대통령으로서의 막강한 권한을 행사했으나 오히려 그로 인한 역풍을 견디지 못했다.

스몰 데이터는 그냥 데이터로서 오래 전부터 존재했다. 빅 데이터 광풍이 불면서 볼륨, 속도, 다양성이 강조됐고, 그래서 이후 불필요하게 스몰 데이터라는 정의가 필요했다.

빅 데이터는 “기계”에 관한 것이고 스몰 데이터는 “사람’에 관한 것이라고 에릭 린드퀴스트가 말한다. 사람들은 나름대로 스몰 데이터를 정의하려고 애쓰지만 스몰 데이터나 빅 데이터나 데이터라는 점에서는 동일하다.

그럼에도 불구하고 지금은 빅 데이터 시대라고 한다. 빅 데이터는 구글이나 페이스북이나 아마존과 같은 기업에게는 생명줄이다. 그런데 탄핵 과정에서 빅 데이터는 큰 기여를 하지 못했다.

구글의 번역기는 수 많은 데이터를 모아 텐서플로우로 계산한다. 그 정확도는 놀라울 정도다. “수능 망했다”를 “인생 끝났다(I lost my life)”, “수능 만점”은 “서울대(Seoul National University)”라고 구글 번역기가 번역한다. 소름 끼치는 번역이다.

박근혜 대통령이 중앙재난대책안전본부에서 세월호 보고를 받는 장면의 사진을 구글 비전 API에 입력해보라. 노란 점퍼에 부스스한 머리 모양을 하고 있는 사진이다. 구글은 92%의 확률로 박근혜 대통령이 ‘사람’이라고 판단하지만, ‘교육’ 또는 ‘학생’이라는 현실과 동떨어진 답을 내기도 한다. 그렇지만 딥러닝이 놀라운 수준에 도달한 것은 사실이다.

빅 데이터 분석이 필요한 분야가 있고, 스몰 데이터가 필요한 분야가 있다. 우리는 그 동안 너무 빅 데이터를 강조했다. 이제는 데이터 분석의 본질을 돌아봐야 한다. 그 본질은 신뢰할 수 있는 데이터의 확보 여부에 있다.

마케팅의 대가인 린드스트롬의 스몰 데이터에 대한 견해로 다시 돌아가자. 그는 빅 데이터의 대안으로서 작은 샘플에 대한 예리한 관찰과 정교한 직관을 강조한다.

사우디 아라비아의 가정에서는 부모들이 어린 애들의 손이 닿지 않게 냉장고 상단에 마그넷을 붙인다. 그런데 시베리아 가정에서는 낮은 쪽에 마그넷을 붙였다. 상대적으로 사우디 아라비아 가정에서는 장난감을 많이 사지만 시베리아에서는 마그넷이 장난감 대용임을 알았다. 린드스르롬은 그 점에 착안해 새로운 러시아 타입의 장난감 회사를 출범시켰다.

탄핵으로 어수선한 이때 스몰 데이터든 빅 데이터는 데이터 분석의 소중함을 돌아보는 계기로 삼으면 좋겠다.

 

김형중 교수  khj-@korea.ac.kr

<저작권자 © 한국뉴스투데이, 무단 전재 및 재배포 금지>

김형중 교수의 다른기사 보기
icon인기기사
기사 댓글 0
전체보기
첫번째 댓글을 남겨주세요.
Back to Top