미디어오늘

빅데이터 신화라고? “실속없는 거품이다”
빅데이터 신화라고? “실속없는 거품이다”
김동환 중앙대 교수, “지식인들이 빅 데이터 거품 몰고 왔다”

우리나라의 빅 데이터 유행이 거품이라는 주장이 제기됐다. 김동환 중앙대학교 공공인재학부 교수는 지난 29일 오후 정보인권연구소가 마련한 강연 ‘빅 데이터의 진실과 거짓말’에서 “빅 데이터 유행이 시작된 건 정확히 2011년 11월7일”이라고 말했다. 그는 이 자리에서 빅 데이터 유행의 거품과 이전 정부들의 빅 데이터 정책의 문제점을 지적했다.

김 교수에 따르면 이명박 정부 시절부터 추진된 빅 데이터 활용 정책은 시작부터 문제가 있었다. 그는 “이명박 전 대통령이 2011년 11월7일 제3차 국가정보전략위원회에 참석하고 그날 오후에는 에릭 슈미트 당시 구글 회장과 면담을 가진 후 빅 데이터를 전폭적으로 밀어주겠다고 발표했다”고 말했다. 그는 그 배경에 10월26일 이각범 당시 국가정보화전략위원회 위원장이 발표한 보고서 ‘빅 데이터를 활용한 스마트 정부 구현(안)’가 있을 것이라 추측했다.

김 교수는 “보고서에서 ‘빅 데이터가 왜 중요한지에 대해 두 가지 근거를 들었는데 첫째는 ’모방‘이고 둘째는 ’오해‘였다”고 말했다. 이 보고서는 빅 데이터의 활용 가치에 대해 “미래 국가 경쟁력은 '빅 데이터'의 활용에 달렸다”며 그 근거로 “미국의 대통령 과학기술자문위는 '모든 미국 연방 정부 기관은 빅 데이터 전략이 필요하다'고 강조”했음을 들었다.

▲ 김동환 중앙대학교 공공인재학부 교수는 지난 29일 오후 정보인권연구소가 마련한 강연 ‘빅 데이터의 진실과 거짓말’에서 강연하고 있다.
▲ 김동환 중앙대학교 공공인재학부 교수는 지난 29일 오후 정보인권연구소가 마련한 강연 ‘빅 데이터의 진실과 거짓말’에서 강연하고 있다.
더 큰 오해는 빅 데이터의 기능에 대한 점이었다. 이 보고서는 “분석·예측 시대의 도래로 빅데이터를 활용하는 효율적인 정부 운영을 도모하는 선진국들의 현황으로 볼 때, 빅데이터를 활용하지 못하는 정부는 국제 사회에서 국가 경쟁력 하락의 위험과 대면하게 될 것”이라고 밝혔지만 김 교수는 “지금 인류의 기술로는 미래를 예측할 수 없다”고 지적했다. 빅 데이터는 과거의 자료들을 수집·분석해서 의미를 도출하는 데에 유의미할 뿐, 미래까지 예측할 수는 없다는 주장이다.

이각범 전 위원장의 보고서에서 빅 데이터의 미래 예측에 대해 근거로 든 자료는 2009년 2월19일 ‘네이처’지에 발표된 구글의 논문 ‘검색 엔진 쿼리 데이터를 이용해 독감 유행 추적하기’다. 해당 논문은 100만 명의 소셜미디어 데이터를 분석해 미국인 중 독감에 걸린 이들을 추정한 논문이다. 김 교수는 “예측이 아니라 추적·추정한 것”이라며 “미래 예측이라고 생각했으면 이 위원장이 오해한 것이고, 알면서도 대통령에게 이렇게 보고했다면 사기 친 것”이라고 목소리를 높였다. 보고서에서 해당 그래프는 ‘구글 독감 예상치와 실측데이터’로 소개돼 있었다.

▲ 이각범 전 위원장의 ‘빅 데이터를 활용한 스마트 정부 구현(안)’(왼쪽)에 소개된 그래프와 구글의 ‘검색 엔진 쿼리 데이터를 이용해 독감 유행 추적하기’에 소개된 그래프.
▲ 이각범 전 위원장의 ‘빅 데이터를 활용한 스마트 정부 구현(안)’(왼쪽)에 소개된 그래프와 구글의 ‘검색 엔진 쿼리 데이터를 이용해 독감 유행 추적하기’에 소개된 그래프.
미국의 기술 연구 자문 회사인 ‘가트너’가 신 기술을 분석, 성숙도를 평가하기 위해 매년 발표하는 ‘하이프 사이클’에서도 빅 데이터는 2014년을 마지막으로 자취를 감췄다.

그렇다면 구글은 어떻게 빅 데이터를 강조하면서 매출을 올리는 것일까. 그는 “결국 구글은 자기들이 어떤 상품을 판매하는가에는 관심이 없고, 얼마나 거품 있는 유행을 창출해 회사의 주가를 올리느냐에 관심이 있는 것”이라고 지적했다. “그럼 우리나라는요? 그동안 5000억을 쏟아부었지만 실익이 없었습니다.” 그가 말했다.

김 교수에 따르면 이 전 대통령의 ‘빅 데이터’ 선언 이후 각 부처는 스마트 국가 구현을 위해 ‘재난예측시스템’, ‘범죄예측시스템’ 등을 포함한 빅데이터 마스터 플랜을 만들었다. 박근혜 정부 때인 2015년, 김포시는 빅데이터 기반 안전도시를 조성하겠다며 주식회사도 설립했지만 “장기간 표류 중”이다. 김 교수는 “그나마 잘 한 게 서울시가 KT 휴대전화 사용자의 빅 데이터를 활용해 심야버스 노선을 최적화한 사례”라면서 “이것도 미래 예측 프로젝트가 아니라 과거 일을 분석한 일이었다”고 말했다.

김 교수는 빅 데이터 거품을 몰고온 것은 지식인들이라고 지적했다. “빅 데이터뿐만 아니라 인공지능, 4차 산업혁명 등은 일련의 거품이고 실속이 없는 것”이라면서 “사람들은 우리나라의 기술 진보가 느려서라고 말하지만 근저에는 지식인들의 천박함과 사이비 근성이 있다고 본다”고 밝혔다. 그는 “최근 문재인 정부의 ‘4차산업혁명위원회’ 소속 위원들도 ‘4차 산업혁명은 뻥’이라고 이야기하는데, 그 이유가 ‘미국 연구소를 아무리 살펴봐도 이들은 4차 산업혁명에 대해 말하지 않는다’는 것”이라며 “반가워해야 하는지 황당해해야 하는지 모르겠다”고 말했다.

그는 오히려 독일의 ‘인더스트리 4.0’처럼 사이버 공간에 있는 정보들을 물리적 공간에 환원시켜 실제 제조업과 연결시키는 시도가 필요하다고 주장했다. 그는 대표적인 사례로 IoT(Internet of Things·사물인터넷)을 들었다. “독일에서 강조하는 건 CPS(Cyber Physical System)입니다. 물리적 공간을 동반해야지 사이버 상의 정보가 의미 있어진다는 것이죠. 그러면 제조업도 살아나게 됩니다.” 김 교수가 말했다.

이날 강연은 20명의 시민 및 시민단체 회원들이 모인 가운데 진행됐다. 강연을 주최한 정보인권연구소의 오병일 활동가는 “정부가 신 산업을 빨리 육성해야 한다고 몰고가는 측면이 있는 것 같다”며 “이런 흐름에 대해 찬찬히 생각해보고 반성적으로 평가해보는 자리가 필요하지 않을까라는 취지에서 자리를 마련했다”고 밝혔다.

김동환 교수는 1980년대 후반부터 인공지능을 전공하고 한국전자통신연구원을 거쳐 현재 중앙대에 재직중이다. 지난해에는 책 ‘빅데이터는 거품이다’(페이퍼로드)를 펴냈다.

이 기사를 후원합니다.


이 기사는 논쟁 중
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 4
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
;; 2018-03-19 10:36:38
IT 종사자분들 아니죠?? 세계 기업들이 괜히 빅데이터에 투자하는줄 아나.... 머리 있으면 조금만 생각하면 얼마나 가치 있는지를 알텐데

rotten 2017-12-02 23:41:40
박근혜 대선때 이 빅데이터를 이용한 댓글공작을 펼쳤다는 이야기가 있지요. 외국 프로그램인데 지금도 있는 빅데이터 분석+활용 프로그램(Lithium)이지요. 그 프로그램의 주요 내용 중 하나는 SNS 상의 빅마우스를 활용하는 것이었다네요. 몇 억 정도를 프로그램 구입하는데 썼다는 소문(!)이 돌았는데 사실인지 아닌지는 아무도 모르지요. 증거가 없으니까요.

mirage00 2017-12-02 20:20:56
빅데이터는 통계에 근거한 수치일뿐 정책이나 비지니스 등에 실질적 도움을 주지는 못함. 빅데이터 는 그 태생 자체가 과거에서 현재까지의 수치 데이터 일뿐, 하루가 다르게 가속이 붙어 급변하는 시대에 아무런 도움도 되지 않고 그 데이터에 근거하여 사업이나 정책을 진행 했다가는 망함. 빅데이터상 유동인구 유입이 많고 매출이 많이 나온다고 매장열면 그건 이미 과거에 장사 잘될때의 숫자놀음만 보고 현재 사회의 흐름과 소비추세는 못본채 망하는 지름길. 박근혜때 창조경제 붐. 이명박때 빅데이터 붐 만들어 시간 낭비 돈낭비, 실효성 없음. 해당 소수집단의 배만 불려주는꼴. 빅데이터 수치가지고 사업해보면 이게 얼마나 실용성 없는 숫자놀이인지 금방 알게됨.