26일 건국대학교 새천년관에서 열린 ‘2016 저널리즘의 미래 컨퍼런스’에서 박대민 한국언론진흥재단 미디어연구센터 선임연구위원은 ‘뉴스 빅데이터의 혁신’이란 주제발표를 통해 언론재단이 올해 초 개발에 성공한 뉴스 빅데이터 분석서비스 ‘빅 카인즈’(Big Kinds)를 소개했다. 빅 카인즈는 신문기사 데이터베이스인 카인즈(Kinds)에 빅데이터 분석기술을 접목해 만든 뉴스 분석 솔루션이다.

빅 카인즈에선 형태소(문장 최소단위) 분석, 개체명(인물, 기관, 장소, 사건 등) 분석, 네트워크(기사 속 핵심요소와 특정 키워드 간 관계) 분석이 가능하다. 한국경제는 올해 초 빅 카인즈를 활용해 2012년부터 2015년까지 237개 매체 기사 중 이주노동자와 관련된 1만4530건의 기사를 분석, ‘빅데이터로 본 이주노동자’ 기획기사를 썼다. 한겨레21은 1998년부터 2015년까지 조선·중앙·동아·한국·경향·한겨레 사설 8만3736건을 분석해 언론이 김대중·노무현·이명박·박근혜 대통령에 대해 어떻게 묘사했는지, 대통령과 언론의 관계를 데이터로 드러냈다.

빅카인즈는 콘텐츠 제휴를 맺은 언론사가 실시간으로 보내는 메타데이터를 기반으로 한다. 언론재단은 자동분류시스템으로 기사를 주제별, 명사별로 분류한다. 오늘 언론이 가장 많이 인용한 인용문이나 정보원도 추출할 수 있다. 빅 카인즈는 1945년 해방 이후 모든 기사를 분석할 기반을 조성할 ‘포부’도 갖고 있다.

▲ 박대민 한국언론진흥재단 선임연구위원. ⓒ이치열 기자
박대민 선임연구위원은 이날 발표에서 “언론사는 저작권을 갖고 있고 독자들의 뉴스 소비 데이터를 갖고 있는 인터넷 기업”이라고 정의한 뒤 “뉴스 빅데이터의 목표는 뉴스와 독자소비패턴을 정형화시켜 활용도를 높이는 것”이라고 밝혔다. 박대민 연구위원은 “빅데이터 분석 솔루션은 우리가 제공하겠다”고 전한 뒤 “언론사는 사회적 가치와 비즈니스모델을 함께 가져가야 한다”고 조언했다. 언론재단은 언론사, 학계, 전문가그룹, 스타트업 등을 대상으로 다양한 수익모델을 구축할 예정이다. 빅 카인즈는 모든 제휴 참여매체에 전송료 44만원을 나눠주고 유료서비스 매출의 일부를 분배할 계획도 갖고 있다.

빅 카인즈의 관건은 제휴 매체 확장이다. 제휴가 늘어나야 빅데이터가 늘어나고, 그래야 데이터의 정확도나 영향력이 증가할 수 있어서다. 현재 언론재단과 제휴를 맺은 언론사는 총 37곳. 과거 카인즈 시절(60여개 매체)에 비해서는 참여 매체가 적은 상황이다. 언론재단은 올해 하반기 제휴매체에 방송사 추가하는 등 지속적으로 참여 매체를 늘려갈 계획이다. 언론재단은 현재 한시적으로 빅 카인즈 프로 서비스를 무료로 개방한 상태다.

저작권자 © 미디어오늘 무단전재 및 재배포 금지