빅데이터의 함정, 땅콩회항이 정윤회 사건을 삼켰다?
[바심마당] 박근혜 지지율 상승은 반대층 지지효과… 논리적 일관성 상실, 민의 왜곡 우려
외주민주주의 시대, 여론조사 및 데이터 분석보도 얼마나 신뢰할 수 있나?
결국 지지층 내에서도 상쇄효과도 컸고, 지지율 상승에는 지지층 외에 반대층에서도 지지율이 상승이 크게 기여했음을 알 수 있다. 실제로 한국갤럽의 6월 4째주 조사를 보면 거부권 행사는 정치적 반대층에서는 압도적으로 반대가 많았을 뿐 아니라 물론 새누리당 지지층에서조차 열 명 중 네 명은 반대하거나 입장을 유보한 사안이다. 박 대통령에 맞선 유승민 대표사퇴에 대해 PK에서는 사퇴 반대가 많았고, TK에서조차 대표사퇴에 찬반이 엇갈렸다.
그럼 무엇이 지지율 상승을 이끌었을까? 24일 이후 지지율 상승은 “거부권 행사”와 같은 정치적 성향에 따라 입장이 갈리는 “이념적 이슈(ideological issue)” 가 아닌 성향과 관련 없이 같은 방향으로 반응하는 “합의가능 이슈(valence issue)”의 영향으로 보는 것이 타당할 것이다. 이렇게 보면 메르스 효과를 주효과로 보는 것 보다 설득력 있다. 실제로 한국갤럽의 6월 네째주 조사에서 이미 대통령 지지율 부정평가 이유를 보면 “메르스 대처를 못해서”를 꼽은 응답이 눈에 띄게 감소하는 경향을 보여주고 있었다(한국갤럽 정기조사 6월 넷째주 6%p 감소, 7월 첫째주 11%p감소).
사례 2 : 조현아 ‘땅콩 회항’ 터진 후 정윤회 사건은 언급량 줄어
빅데이터 열풍으로 빅데이터 분석기법을 활용한 언론을 통해 경쟁적으로 보도되고 있다. 방대한 데이터양과 고도의 분석기법이 활용됨에 따라 일반국민은 물론 정부 및 정치권 정책결정자들도 무차별적으로 수용하기 쉽다. 지난 연말 정국을 달구었던 정윤회 사건(11월 24일), 조현아 땅콩회항 사건(12월 8일), 12월 19일 통합진보당 해산결정(12월 29일)까지 트위터와 블러그 등 SNS에서의 언급량 보도를 보자(그림2).
“조현아 ‘땅콩 회항’ 터진 후 정윤회 사건은 언급량 줄어”라는 제목의 언론보도에서는 정윤회 문건 유출 사건이 촉발된 “11월 28일 1만5055건을 기록하고”, “조응천 전 청와대 공직기강비서관과의 공방이 이어진 12월 2일 2만6857건으로 정점을 찍었다”고 보도했다. 12월 9일 이후 ‘정윤회-조현아’ 키워드 비교탐색 결과를 제시하며, 조현아 ‘땅콩회항’ 사건 이후 정윤회 사건 언급량‘이 줄었다고 분석했다. 이러한 결과가 조현아 땅콩 회항 사건을 덮기 위한 음모론을 뒷받침하는 것은 아니라고 분석하면서도 기사의 제목은 최소한 조현아 땅콩 사건으로 정윤회 사건 언급량이 줄어든 것은 팩트로 인정했다. 음모론이나 의혹으로 번질 여지가 충분하다.
그러나 조현아 땅콩 사건과 정윤회 사건 언급량 변화 사이의 관계를 그래프를 통해 확인해보면 기사의 제목과 본문 사이에 음모론에 대한 이해에 미묘한 차이가 있음을 보여줄 뿐 아니라 기사와 본문 모두 사실관계에 대한 혼선을 불러일으킬 가능성이 크다.
물론 12월 8일로 그 이후로 보면 땅콩 회항사건에 대한 언급이 정윤회 사건 언급을 넘어선 것은 사실이다. 그러나 정윤회 사건에 대한 언급량이 줄기 시작한 시점은 땅콩 회항 사건 일주일 전인 12월 2일 정점을 찍었다. 즉 12월 2일 이후 땅콩 회항 사건이 일어나기 ‘이후’ 가 아닌 ‘이전’에 이미 정윤회 사건 언급량은 급감하는 양상으로 볼 수 있다. 땅콩회항 사건 하루 전 정윤회 사건에 대한 언급량이 다소 증가하는 양상을 보이고는 있으나 그 폭이 사건 초기의 증가 속도와는 차이가 있으며, 장기적으로는 하락 추세에 들어섰다는 해석도 가능한 자료이다. 즉 제시한 데이터를 보면 땅콩 회항 사건과 정윤회 사건에 대한 SNS 상의 언급량 사이의 인과관계는 커녕 상관관계 자체도 모호하다.
그래프를 보면 최대 관심사는 조현아 사건 이후 정윤회 사건 언급이 감소한다는 12월 8일 이후 시점보다는 11월 말부터 12월 초까지 정국을 뒤흔들던 정윤회 사건이 감소한 시점이다. 즉 12월 2일을 정점으로 이미 정윤회 사건에 대한 SNS에서 언급량은 급격하게 감소하는 추세를 보여주고 있다. 오히려 이 시기에 정윤회 사건에 대한 SNS 상의 논의가 감소한 이유가 무엇인지 규명하는 것이 현상을 정확히 이해하는 데 중요한 단서를 제공할 것으로 보인다. 이상의 내용을 보면 빅데이터 분석이라는 거창한 제목에 비해 분석결과에 대한 해석은 치밀하지 못하고 오히려 인식의 혼선과 의혹을 유발하는 측면이 크다.
클릭수 염두, 데이터 분석 보도: 콘텐츠의 부실화, 왜곡 가능성 높여
외주민주주의 폐해 증폭 : 정책결정자 및 유권자 오판 불러
여론조사든, 빅데이터 분석이든 객관적인 조사 데이터 및 과학적인 분석기법을 활용하여 도출한 콘텐츠로 인식된다는 점에서 다른 어떤 언론보도 보다도 많은 관심을 끌게 된다. 이에 따라 주요 선거가 끝나면 조사방법 및 데이터의 신뢰성에 대한 논란이 발생한다. 그러나 최근 정국의 핵심 이슈였던 두 사례를 살펴보면 조상방법 못지 않게 정책결정자나 유권자들에게 전달되는 컨텐츠에서의 부실과 왜곡 가능성이 크다는 것을 보여준다.
잘못된 데이터 해석은 대통령과 정치권에 국정 및 정치상황에 대한 오판을 낳는다. 거부권 행사 조사보도만 보더라도 거부권행사로 대통령의 지지가 상승할 수 있다는 해석은 콘크리트 지지층에 대한 과대평가를 낳을 수 있다. 대통령과 친박강경파 의원들로 하여금 유승민 전 대표에 대한 강한 압박을 밀어붙이는 근거가 되었을 수도 있다. 실제로 의도와 무관하게 현 정부의 성공여부에 대한 관심을 차기대선경쟁으로 돌려 놓았고, 힘으로 제압하려고 했던 유승민 전 대표를 일약 여권의 잠룡으로 만들었다. 땅콩회항 사건 SNS분석은 사건 이전에 정윤회 사건에 대한 언급량이 정점을 찍은 이유에 대한 분석은 도외시함으로써 음모론에 무게를 실을 수 있는 여지를 남겼다. 데이터 분석관련 언론보도에서 손쉽게 찾아볼 수 있는 사례들이다.
데이터기반 콘텐츠의 외주화에 따른 부실 분석과 선거 및 정책결정과정에서의 민의 왜곡 가능성에 비상한 관심과 대책이 필요하다. 혹여 언론의 입맛에 맞게 임팩트 있는 보도 자료를 생산하려는 조사기관 및 이를 무비판적으로 받아 적는 언론의 자성과 인식전환이 시급하다. 단기적으로는 클릭수는 높일 수 있지만, 장기적으로 신뢰를 잃는다. 특히 각 언론 미디어 차원에서 커지는 데이터 기반 의사결정 및 분석에 대한 모니터링과 검증할 수 있는 역량과 프로세스를 갖춰나갈 필요가 있어 보인다. 정책결정자 및 정치권 역시 언론의 조사데이터 보도를 비판적으로 평가하여 활용할 수 있는 전문적 역량과 안목을 키우는 것이 필요하다. 미디어의 보도, 전문기관의 발표라고 쉽게 맹신할 경우 엉뚱한 의사결정으로 심각한 피해를 초래할 수도 있을 것이다. 마지막으로 한국사회의 최종 주권자인 국민 스스로 데이터 기반 분석과 보도 콘텐츠들에 대해 경계등을 키고 비판적 시각에서 콘텐츠를 취사선택하는 자세를 견지해야 할 것으로 보인다. 잘못된 데이터분석 기반 정책결정의 최대 피해자는 유권자 자신이기 때문이다.
아침신문 솎아보기
언론의 자유가 위협받는 시대, 더 나은 세상을 바라는 시민의 힘에 기대어 올곧은 기사로 보답하겠습니다.