한 장의 사진이 수많은 기사보다 더 정확히 현실을 웅변할 때가 있다. 한 장의 그래프가 장황한 설명보다 훨씬 더 적나라하게 핵심을 짚어낼 때가 있다. 그러나 한 장의 사진을 찍기 위해 오랜 기다림과 수많은 시행착오를 감내해야 하는 것처럼 한 장의 그래프를 만들기 위해서는 방대한 데이터를 수집하고 분석하고 그 가운데서 유의미한 팩트를 뽑아내야 한다. 데이터 저널리즘이 주목받고 있는 것은 그런 이유에서다. <편집자 주>

고발·폭로 전문 소셜 미디어, 위키리크스가 지난 8월 아프가니스탄 전쟁 기밀문서 9만1천여건을 공개했을 때 언론사들은 고민에 빠졌다. 어마어마한 분량의 데이터가 있다. 여기에서 어떤 이야기를 끌어내야 할까. 그 이야기를 독자들에게 어떤 방식으로 전달할 수 있을까. 시간은 짧고 숫자는 너무 많았다. 대부분의 기자들은 도대체 무엇을 어디에서부터 시작해야 할지 알 수가 없었다.

이 사상 최대의 폭로 사건을 다룬 가디언의 경험은 주목할 만하다. 가디언은 우선 ‘급조 폭발물(IED)’이라는 키워드를 검색해 데이터베이스를 구축했다. 그리고 IED 공격이 어떤 지역에서 발생했는지 그리고 희생자 수는 어느 정도인지 등을 집계해서 이를 지도 위에 표시했다. 이 지도 한 장이 아프가니스탄에서 벌어진 참혹한 전쟁의 실상을 일목요연하게 드러냈다. 가디언은 이 지도를 전면에 내걸고 수많은 분석 기사를 쏟아냈다.

   
     
 
가디언은 일찌감치 데이터 저널리즘의 전망을 내다보고 전문 인력을 양성해 왔다. 과거에는 정부 기관이나 연구소, 기업이 발표하는 데이터를 적당히 받아쓰기만 하면 됐지만 이제는 기자들이 공개 릴리즈된 데이터의 이면을 파헤치는 것은 물론이고 직접 데이터를 수집해서 분석하고 그 가운데서 유의미한 팩트를 뽑아내고 비주얼하게 또는 인터랙티브하게 가공하는 작업까지 해야 한다고 봤기 때문이다.

가디언의 데이터 저널리즘 노하우는 세계에서 가장 앞서 있는 것으로 평가된다. 국내 언론이 벤치마킹할만한 사례로는 ‘정부 공약 검증(pledge tracker)’이라는 서비스가 있다. 가디언은 지난 8월 영국 보수·자유민주당 연립내각의 출범 100일을 맞아 이들이 내건 433개의 공약의 이행 상황을 한 눈에 살펴볼 수 있는 서비스를 시작했다. 어떤 공약을 지켰는지, 진행 중인지, 포기했는지, 애초에 실행 불가능한 공약이었는지 등을 집계해서 보여준다.

가디언은 최근 영국 정부가 공개한 정부 예산 지출 현황 자료를 인포그래픽(정보+그래픽)으로 제공해 화제를 불러 모으기도 했다. 무려 19만4061개 항목, “데이터의 쓰나미”라고 불릴 정도로 방대한 데이터였는데 가디언은 이를 유형 별로 집계할 수 있는 분석 도구를 만들어 웹에서 서비스하고 있다. 엑셀 파일로 있을 때는 엄두도 내기 어려운 일이었지만 독자들도 누구라도 항목 별로 지출 내역을 산출하고 비교·분석할 수 있게 됐다.

‘월드 와이드 웹’이라는 개념을 처음 창안한 팀 버너스리는 가디언과 인터뷰에서 “미래의 언론인은 데이터를 다루는 일에 지금보다 훨씬 더 익숙해져야 할 것”이라고 전망하기도 했다. 버너스리는 심지어 “기자들도 이제 직접 CSV 파일을 분석하고 PHP 프로그래밍을 하고 API를 다룰 줄 알아야 한다”고 말한다. 다소 과장된 전망이지만 데이터 분석과 가공, 비주얼라이제이션이 새로운 스토리 텔링 비법으로 자리 잡고 있는 것은 부정할 수 없는 사실이다.

   
     
 
가디언의 데이터 저널리즘 에디터인 사이먼 로저스는 “가디언의 데이터 분석 기술은 복잡하지 않다”고 설명한다. 가디언은 무료 소프트웨어인 구글 스프레드 시트를 활용해 데이터를 공유한다. 비주얼라이제이션 도구 역시 매니아이스(Many Eyes)나 타임트릭(Timetric) 같은 공개 소프트웨어를 쓴다. 가디언 데이터 저널리즘 팀은 기존 뉴스의 보조 역할을 하기도 하지만 독자적으로 뉴스를 발굴해서 생산할 때도 많다.

로저스는 “가디언은 직접 서베이를 통해 데이터베이스를 구축하기도 하지만 대부분의 데이터는 이미 PDF 파일 형태로 정부 웹 사이트 등에 존재하는 것들”이라면서 “넘쳐나는 데이터를 수집해서 분류하고 콘텍스트를 부여하는 것이 우리들 작업의 핵심”이라고 말한다. 로저스는 “우리는 모든 원본 데이터를 웹 사이트에 공개해서 독자들이 직접 확인할 수 있도록 하는데 추가 제보나 기사 아이디어를 독자들에게 얻는 경우도 많다”고 설명한다.

언론인 교육 기관인 유럽저널리즘센터는 “대형 사건이 발생하면 수많은 인터뷰와 전문가 분석과 폭로, 전망 기사가 쏟아져 나오지만 정작 독자들은 두어 달이 지나면 사건의 맥락을 놓고 관심을 잃게 된다”고 지적했다. 인포그래픽 전문가인 스테판 피첼은 이 센터와 인터뷰에서 “넘쳐나는 뉴스가 오히려 큰 그림을 그리는데 방해가 된다는 사실을 명심하라”면서 “핵심을 관통하는 인사이트를 독자들에게 제공할 수 있어야 한다”고 강조했다.

가디언 뿐만 아니라 뉴욕타임즈도 데이터 저널리즘 기법에서 앞서 있다는 평가를 받는다. 뉴욕타임즈는 지난 독일 월드컵 때 경기 결과를 비주얼한 그래픽 이미지로 구현해 큰 인기를 끌었다. 선수들 포지션 위로 마우스를 갖다 대면 골 점유율과 패스 경로, 유효 슛 등이 표시돼 경기 중계와는 또 다른 재미를 줬다는 평가다.

   
     
 
   
     
 
뉴욕타임즈는 최근 테크놀로지 매니저와 멀티미디어 저널리스트 등을 대거 채용하기도 했다.
바야흐로 읽는 뉴스에서 보는 뉴스로 이행하고 있다는 사실에 주목할 필요가 있다. 온라인 저널리즘 전문가인 폴 브래드쇼는 “데이터 저널리즘이 전통 저널리즘을 대체하지는 않겠지만 전통 저널리즘을 구원할 수는 있다”면서 “발상의 전환과 뉴스룸의 혁신이 전제돼야 한다”고 지적했다. 미국의 포털 사이트 AOL의 최고 경영자인 팀 암스트롱은 “기자들의 기술 공포증을 극복해야 한다”고 조언하기도 했다.

그러나 국내 현실은 아직까지 요원하기만 하다. 상당수 신문사들이 여전히 오프라인에 묶여 있고 공공 데이터베이스 역시 턱없이 부족한 상황인데다 데이터 분석은커녕 엑셀 조차도 다루지 못하는 기자들이 대부분이다. 정부가 발표하는 엉터리 통계가 아무런 검증 없이 인용되는 경우도 흔하다. 온라인 서비스는 오프라인 기사를 그대로 전재하는데 그치고 있고 인포그래픽은 엄두도 내지 못한다.

이성규 매일경제 미디어연구소 연구원은 “독자들은 여러 사회 현상과 팩트를 더 직관적으로 접하고 싶어 한다”면서 “전통적인 저널리즘의 가치 못지 않게 테크놀로지가 중요한 시대가 됐다”고 지적했다. 최진순 한국경제 전략기획국 기자도 “데이터 수집과 분석, 비주얼라이제이션이 갈수록 중요하게 될 거라는 전망이 많은데 국내 언론사들은 투자가 부진할 뿐만 아니라 뉴스룸 시스템 역시 오프라인 편중을 벗어나지 못하고 있다”고 지적했다.

저작권자 © 미디어오늘 무단전재 및 재배포 금지