구글의 수석 이코노미스트인 할 베리안은 “앞으로 10년 동안 가장 인기있는 직업은 통계 분석가가 될 것”이라고 전망한 바 있다. 베리안은 “내가 이렇게 말하면 농담을 하는 줄 알지만 10년 전에 컴퓨터 엔지니어가 가장 인기 있는 직업이 될 거라고 누가 예측을 했겠느냐”고 반문한다. 베리안은 “데이터를 수집하고 분석하고 그 가운데서 의미를 뽑아내는 능력이 높이 평가받게 될 것”이라고 강조했다.

뉴미디어 전문 블로그 리드라이트웹은 “기자들은 점점 더 데이터에 의존하게 될 것”이라면서 “데이터 기반 취재(data-driven reporting)이 기자의 두 번째 영역이 될 것”이라고 전망하기도 했다.

가디언의 데이터 저널리즘 전략을 진두 지휘하고 있는 폴 브래드쇼는 “데이터의 세계는 방대하지만 효과적인 도구를 적절히 활용한다면 덤벼볼 만하다”고 말한다. 가디언은 탐사 보도와 리서치, 통계, 디자인, 프로그래밍을 결합하는 작업을 계속해 왔다. 브래드쇼는 데이터 저널리즘의 4가지 요소를 다음과 같이 정리하고 있다.

1. 데이터를 찾아라.
꾸준히 트위터를 읽고 RSS 피드를 검색하라. MySQL이나 파이썬 같은 프로그램을 활용해 광범위한 데이터를 수집하라.
2. 데이터를 분석하라.
넘쳐나는 숫자들의 조합에서 의미를 짚고 콘텍스트를 읽어내라. 스프레드시트에 익숙해지면 훨씬 많은 시간을 절약할 수 있을 것이다.
3. 데이터를 시각화(visualise)하라.
시각화는 디자이너와 프로그래머의 영역이었으나 이제는 편집 경험을 갖춘 전문가들이 늘어나고 있다. 데이터 저널리즘의 무한한 가능성이 부각되고 있기 때문이기도 하지만 업종 간 장벽이 낮아지고 있기 때문이기도 하다.
4. 데이터를 결합(mash)하라.
매니아이 같은 시각화 도구와 야후 파이프 같은 매쉬업 도구를 활용하면 훨씬 손쉽게 데이터에서 의미를 뽑아낼 수 있다. 데이터의 오류를 잡아내는 것도 훨씬 쉽다.

브래드쇼는 데이터 저널리즘을 어떻게 시작할 것인지 묻는 질문에 “첫째, 데이터가 있어야 하고 둘째, 질문이 있어야 한다”고 설명한다. 브래드쇼는 “결국 핵심은 어떻게 유의미한 팩트를 끌어내느냐에 있다”고 강조했다. 이를테면 공무원들 임금 데이터를 확보했다고 해도 다른 직업군과 비교하거나 물가 상승률과 전체 국민 소득 추이를 반영해서 콘텍스트를 읽어내는 것이 진짜 중요한 작업이라는 이야기다.

가디언의 에디터 챨스 아서는 “숫자로 가장 잘 표현될 수 있는 이야기를 찾으라”고 조언한다. 뉴욕타임즈의 데이터 저널리즘 에디터인 아론 필로퍼는 “당신이 정확히 이해하고 있는 것부터 시작하라, 그러나 데이터 저널리즘의 최종 목표가 역시 저널리즘이라는 사실을 잊어서는 안 된다”고 조언한다.

저작권자 © 미디어오늘 무단전재 및 재배포 금지