한국언론진흥재단이 빅데이터를 활용한 뉴스서비스를 선보인다고 밝혔다.

최민재 언론재단 연구팀장은 26일 제주도 서귀포 스위트호텔에서 열린 ‘디지털 혁신 세미나에서’에서 뉴스와 빅데이터를 접목한 뉴스빅데이터분석시스템 ‘빅카인즈’를 발표했다. 언론재단은 현재 언론 뉴스를 종합해 데이터베이스를 구축한 카인즈 서비스를 실시하고 있는데, 여기에 빅데이터를 통한 서비스 개선을 시도한 것이다. 

빅카인즈는 빅데이터를 통해 ‘키워드 분석’을 실시한다. 검색 키워드에 대한 연관 키워드를 관계도 형식으로 보여준다. 예를 들어 ‘신동빈’이라는 키워드를 검색하면 ‘인물’에는 ‘신격호’, ‘신동주’가 뜬다. ‘장소’에는 ‘광운사’, ‘롯데호텔’, ‘인천공항’이 뜬다. ‘조직’에는 ‘롯데홀딩스’, ‘롯데호텔’이 뜨는 식이다. 

‘인물발언 인용서비스’도 있다. 특정 인물을 검색하면 언론 기사에 나온 인물의 발언을 시간순서로 보여준다. 이 기능은 기사에서 인용부호(“”)처리된 내용을 추출하는 기술을 통해 만들어지게 된다. 기술적으로는 박근혜 대통령을 검색하면 “경제민주화를 이룩하겠습니다.”, “규제는 암덩어리입니다.”, “역사에 관한 일은 역사학자들이 판단해야 한다고 생각합니다.”, “잘못된 역사를 배우면 혼이 없거나 비정상입니다” 등 박근혜 대통령의 발언들이 뜨게 된다.

   
▲ 빅카인즈 메인화면.
 

뉴스히스토리는 맥락저널리즘을 돕는다. 해당 이슈가 어떤 맥락으로 쓰이는지 알수있도록 시간순으로 관련 기사를 제공하고 주요키워드에 대한 지식정보를 사전형태로 제공한다. 특정 키워드에 대한 언론사별 언급회수, 매체별 점유율도 나타난다. 특정 키워드가 10년간 뉴스속에서 얼마나 언급돼왔는지 분석하는 기능도 있다. 구글엔그램뷰어와 유사한 서비다.

그러나 이미 네이버와 다음 등 포털사이트에서 뉴스검색 서비스를 실시하고 있는 상황이다. 빅카인즈가 폭 넓은 독자를 확보한다는 보장이 없기 때문에 자칫하면 예산낭비에 그칠 우려가 있다. 무엇보다 문화체육관광부 산하기관인 언론진흥재단에서 선보이는 서비스이기 때문에 정부여당에 비판적인 데이터를 걸러낼 가능성도 있는 것 아니냐는 우려도 나온다. 빅카인즈는 2015년부터 2017년까지 개발해 도입할 계획이다.

저작권자 © 미디어오늘 무단전재 및 재배포 금지