“일베, 그들은 굉장히 점잖은 1등 사윗감들이다. 왜? 이들의 이상적 대상은 대구에서 서울로 상경해 성공한 아버지다. 항상 열심히 일하고 (가족을 위해) 헌신해 성과를 일궈낸 사람들이다.” 극우 커뮤니티 일베를 어떻게 단순화해 설명했을까? 일베에 대해 여러 언론과 빅데이터를 수차례 분석했기 때문이다. 

지난 5년간 소셜 빅데이터 의미망 분석을 해온 아르스프락시아(옛 트리움)의 이종대 이사는 “일베 텍스트와 일베 유저들을 인터뷰해 그들의 텍스트를 분석한 결과 그들은 아무런 노력없이 무임승차한 사람들을 싫어하는 점”을 일베가 패륜적인 메시지를 쏟아내는 이유라고 분석했다.

이 이사는 다양한 빅데이터를 분석해 그 안에 녹아있는 의미를 뽑아낸다고 전했다. 싸이의 강남스타일이 전 세계적으로 퍼져나간 시발점은 어디였을까? 아르스프락시아는 빅데이터 분석을 통해 싸이 소속사의 한류 팬들이라는 것을 찾아냈다. 이 이사는 “YG의 한류 팬들이 아니었다면 초반의 붐업이 가능했을까 싶다”고 말했다. 

   
▲ 아르스프락시아 홈페이지 화면 갈무리.
 

빅데이터는 변화를 발 빠르게 감지하기도 한다. 아르스프락시아는 트워터 여론을 분석하는 과정에서 지난 대선 1년 전인 2011년 11월 국정원의 트위터 여론 개입 정황을 발견했다. 이 이사에 따르면 당시 시사인에서 의욕적으로 관심을 보였지만 빅데이터는 여론 개입 심증은 줬지만 구체적인 물증은 주지 못했다. 따라서 당시 기사화되진 못했다. 

데이터는 색깔이 없다. 이 이사는 “데이터 분석을 할 때 원칙이 있다”며 “미디어는 마감이 있기 때문에 소위 ‘야마’에 맞춰 데이터를 끼워 맞추려 하지만 절충점이 필요하다”고 말했다. 이 이사는 대전제가 정해져 있고 논리적으로 팩트를 뽑아가는 연역과 다양한 사례를 분석하고 추상화해 보편적인 법칙을 찾는 귀납의 절충을 강조했다. 

빅데이터는 정치분야에서도 활용되고 있다. 지난 2012년 대선에서 아르스프락시아는 8000시간 가량의 문재인과 박근혜 당시 후보의 연설문, 현장 발언을 스크립트를 받아 분석했다. 그 결과 문 후보는 ‘정치가 썩었다’는 대전제를 세워놓고 논리적으로 문제를 제기해 대전제를 수용하지 않는 경우는 공감하기 어려웠지만 박 후보는 ‘경제가 위기다’라며 몇 가지 약속을 제기하며 ‘행복시대로 가자’는 메시지를 통해 공감을 이끌어내는 화법을 사용했다는 것을 발견했다.  

   
▲ 지난 대선 당시 박근혜 후보(왼쪽)와 문재인 후보(가운데)
 

선거 국면이 지나고서는 사회 다양한 분야에서 데이터 분석이 활용되고 있다. 특히 지난해 세월호 사건 이후에 사회 분위기 변화도 빅데이터를 통해 감지됐다. 이 이사는 “세월호 이전에는 ‘아이’에 대해 ‘공부나 열심히 했으면 좋겠다’는 키워드에서 세월호 이후 ‘미안’, ‘사랑’, ‘자존감’, ‘이해’와 같은 키워드가 나온다”며 “최근 사회가 파탄돼 왔는데 가족이라는 근본적인 커뮤니티에서 사회적 자본이 축적되고 있는 것”이라고 분석했다.   

유용한 빅데이터가 아직 많은 언론인들에게는 낯선 대상이다. 이 이사는 “모 방송사 부장님이 ‘트위터 3000건이면 빅데이터 아니냐’는 말을 하기도 했는데 빅데이터는 페타바이트(1PB=1027TB) 이상이어야 한다”며 “데이터를 기반으로 기사를 쓰는 것이 아직은 생소한 분위기”라며 관심을 촉구했다. 

저작권자 © 미디어오늘 무단전재 및 재배포 금지