저널리즘은 미디어 생태계의 거대한 지각변동 속에서 생존할 수 있을까. 지난 15일과 16일 양일에 걸쳐 열린 ‘구글 뉴스랩 혁신포럼’과 ‘데이터 저널리즘 코리아 컨퍼런스’는 이 질문에 대한 방안을 모색하는 장이었다. 독자들은 더 이상 전통매체의 복잡하고 긴 기사를 읽을 여력이 없다. “그래서, 어쩌라고?” 이제 독자들은 문제에 대한 ‘답’을 저널리즘에 요구한다. 모바일 온리 시대, 앞으로 어떻게 독자 친화적인 변화를 꾀할 수 있을까. 단비뉴스는 ‘저널리즘의 진화와 혁신’을 주제로 지난 콘퍼런스를 4편에 걸쳐 돌아본다. 이번 기획 시리즈는 미디어오늘과 공동연재 한다. - 편집자주

① 뉴스룸 혁신과 테크놀로지
② 데이터 저널리즘의 도전과 한계
③ 밀레니얼 세대와 미디어 스타트업
④ 저널리즘의 다양성 모색


”우리가 다루는 것은 추상화된 기호다. 그런데 지도상에 나타나는 한 개의 점이 사실은 하나하나의 건물, 사람, 사건이다. 결국 우리가 데이터 저널리즘에서 추구하는 것은 ‘점’이 아니라 현실 세계에 존재하는 ‘무언가’다“

▲ 김승범 VWLAB 소장 사진=이치열 기자
▲ 김승범 VWLAB 소장 사진=이치열 기자

‘2017 데이터 저널리즘 코리아 콘퍼런스’가 지난 16일 개최됐다. 이날 VWLAB(브이더블유랩) 김승범 소장은 데이터를 다루는 태도에 관해 발표했다. 김 소장은 지난 4월 중앙일보와 협업해 ‘고위공직자 2351명 건물 보유 현황 데이터 지도’를 만들었다. 그는 이 주소 데이터 작업을 ‘죽음의 꽃’이라 칭했다. 그만큼 까다롭고 방대한 작업이었다. 그는 “노동집약적인 데이터 정제 과정은 정확성을 위해서이기도 하지만, ‘개별성에 대한 존중’이라고 생각하며 마음을 다스린다”며 방대한 데이터를 다룰 때의 소회를 밝혔다.

▲ 김승범 소장이 제작한 고위공직자 건물 보유 현황 데이터 지도. 사진=중앙일보
▲ 김승범 소장이 제작한 고위공직자 건물 보유 현황 데이터 지도. 사진=중앙일보


어떻게 데이터를 다룰 것인가

김 소장은 주소 데이터 정리 과정에서 습득한 자신의 노하우를 참석자들과 공유했다. 먼저 야생 상태의 주소 데이터를 컴퓨터가 인식할 수 있도록 수작업을 거쳐야만 주소의 정확한 위·경도 좌푯값을 얻어 지도상에 표현할 수 있다. 그런데 우리나라 동 이름에는 법정동, 행정동, 도로명 세 가지 형식이 있고, 주소 체계는 16가지나 된다. 예컨대 ‘반포동’의 법정동은 ‘반포동’이지만, 행정동은 더 세분화된 ‘반포1~3동’이다. 이 주소를 하나의 형식으로 통일하는 작업이 유의미한 데이터를 얻기 위해 반드시 필요하다. 잘못된 주소나 불완전한 주소를 지도에 옮겨야 할 때, ‘국토교통부 실거래가 공개시스템
(http://rt.molit.go.kr)’에서 주소를 검색하면 정확한 주소를 알 수 있다. 이 과정을 거쳐 얻은 데이터를 일괄 숫자로 된 좌표로 변환한다. 이때 지도상에 표현될 위·경도 값이 소수점 5자리 이상 차이 나면 실제 지표 공간에서는 1m 차이가 나므로 조심해야 한다.

이날 ‘데이터 저널리즘과 기술’ 섹션의 진행을 맡은 한운희 엔씨소프트 미디어인텔리전스 태스크포스장은 “이 분야에 관심 있는 언론인들이라면 지도로 만들어지는 데이터 저널리즘에 대한 선망이 있을 것 같다”고 덧붙였다. 이어 한 TF장은 “지도상에 점을 엄청나게 많이 찍다 보면 튀는 게 있다. 그럴 때 실제로 확인하지 않고 '큰 메시지, 큰 맥락에서 차이가 없을 테니까 지우자' 이런 행위가 '실제로 존재하는 무언가를 지우는 것'이라는 걸 데이터 작업할 때 늘 염두에 두고 고민하는 것이 중요한 것 같다"고 전했다. 김 소장은 데이터 지도 제작 시 '공공데이터포털 부동산종합정보
(http://openapi.nsdi.go.kr/nsdi/common/gonggan.do)’와 ‘대한민국 행정동 경계 파일 https://github.com/vuski/admdongkor)’ 사이트를 참고하면 유용할 것이라고 조언했다.

데이터의 보고, 정보공개청구

▲ 전진한 알권리연구소 소장. 사진=조은비 단비뉴스 기자
▲ 전진한 알권리연구소 소장. 사진=조은비 단비뉴스 기자

정보공개청구는 데이터 저널리즘의 꽃이다. 원천 자료를 얻을 수 있는 데이터의 보고이기 때문이다. 정보공개청구는 내년 시행 20주년을 맞는다. 전진한 알권리연구소 소장은 그간 정보공개청구 시스템이 비약적으로 발전했다고 말했다. 그는 “2000년대 초반 정보공개 청구를 할 때만 해도 팩스를 넣어 담당 공무원을 찾고 의사소통하는 과정이 길어 한 건을 청구하는데 한 시간 넘게 걸렸었다”며 이제 누구든 어디에든 정보공개청구를 할 수 있게 됐음을 긍정적으로 평가했다. 전 소장은 16년 동안 정보공개 활동가로 활약한 정보공개청구 전문가로, 현재는 서울시 정보공개 심의를 3년 반째 하고 있다. 그는 정보공개 청구자에서 심의자가 되면서 깨달은 새로운 관점을 소개했다.

“박근혜 전 대통령 때 전두환 전 대통령에게 추징금 내라고 했었죠. 국민들은 추징한다고 하니까 되게 좋아했잖아요. 저는 이때 검찰청에 몰래 추징금 정보공개청구를 했어요. 전두환 말고도 추징금 내야 하는 사람이 많을 것 같다는 생각이 들어서요.”

전 소장은 2013년 대검찰청 부장 검사에게 삼천 페이지가 넘는 추징금 납부 명단 파일을 손수 USB로 건네받은 일화를 공개하며 이런 ‘큰 고깃덩어리’를 언론이 청구해야하지 않겠냐고 말했다. 검찰 조직에겐 추징금 같은 데이터가 자신들의 업적이기 때문에 적극적으로 요청에 응한다는 점을 강조하면서 조금만 관심을 갖고 품을 들인다면 ‘월척’ 데이터를 확보해 특종을 잡을 수 있다고 참석한 기자들에게 힘주어 말했다.

무엇을 데이터 저널리즘으로 만들 것인가

생활 속에서 얻은 정보공개청구 아이디어가 사회적으로 영향을 미쳤던 사례도 들었다. 전 소장은 2013년 어느 날 하루에만 세 번 불심검문을 당했다. 그는 경찰에게 “오늘 내가 세 번이나 잡혔다. 한 사람한테 이렇게 해도 되냐”고 화를 냈다. 경찰은 전자기기로 전 소장을 검색해보더니 “미안하다. 오늘 강도 살인사건이 났는데 인상착의가 비슷해 잡게 됐다”며 양해를 구했다고 한다. 이때 전 소장은 경찰이 어떤 사람을 몇 번 불심검문 했는지에 대한 전국적인 빅 데이터를 가지고 있음에 주목했다.

전 소장은 술에 취한 상태였지만 아이디어를 잠에 뺏기지 않기 위해 귀가하자마자 컴퓨터를 켜고 서울시에서 각 경찰서 별로 수배차량과 사람을 몇 건이나 불심검문 했는지 정보공개를 청구했다. 2013년 한 해 동안 서울지역 경찰은 ‘휴대용 신원조회기’를 이용해 640만명을 불심검문했다. 경찰청 개설 이후 최고의 기록이었다.

▲ 2014년 1월 한겨레신문 1면에 단독 보도된 ‘경찰 불쑥 “신분증 봅시다”…불심검문, 현 정권 들어 2배’ 기사 갈무리. 사진=한겨레신문
▲ 2014년 1월 한겨레신문 1면에 단독 보도된 ‘경찰 불쑥 “신분증 봅시다”…불심검문, 현 정권 들어 2배’ 기사 갈무리. 사진=한겨레신문

더 놀라운 것은 수배차량 기록이었다. 1년에 4700만대를 했다. 알고 보니 수배차량을 잡으면 자기 승진 점수의 3분의 2를 채우기 때문이었다. 전 소장은 “이런 것들이 바로 인권침해로 이어진다”며 정보공개청구 결과가 당시 한겨레신문 1면에 났으며 사회적 파장을 불러일으켰다고 회고했다. 이후 경찰청은 불심검문을 없애겠다고 발표했고, 실제로 2년 동안 불심검문을 하지 않았다고 한다. 경찰은 임의동행기록 등 인권침해 가능성을 시사하는 빅 데이터를 가지고 있는 조직이다. 이 데이터를 청구할 권리가 모든 사람에게 있다. 전 소장은 “공권력 남발에 관한 데이터가 세상에 공개되면 세상을 바꿀 수 있다”며 현업에서 데이터 저널리즘을 하고 있는 언론인들이 토로한 한계를 넘을 수 있는 돌파구로 이런 이슈를 데이터 저널리즘에 접목시켰으면 좋겠다고 제안했다.

알아두면 유용한 공개정보 사이트

▲ 서울시 정보소통광장 사이트 갈무리. 사진=정보소통광장
▲ 서울시 정보소통광장 사이트 갈무리. 사진=정보소통광장

서울시는 박원순 시장 취임 후 ‘정보소통광장
(http://opengov.seoul.go.kr)’ 사이트를 개설했다. 전 소장은 박 시장에게 정보공개청구도 번거로운 과정이기 때문에 과장급 이상의 결재를 받은 기안문서는 비공개 문서를 제외하고 다 공개해 두는 것이 어떻겠냐고 제안했고 정책으로 실현됐다. 서울시는 40억6천만원을 들여 정보공개사이트를 개설했다. 전 소장은 “이 사이트에 당장 활용할 수 있는 빅 데이터들이 넘친다”면서 언론인들이 이 사이트를 많이 이용했으면 좋겠다고 전했다. 조용현 서울시 통계 데이터 담당 주무관은 ‘전국 공공데이터(http://data.go.kr)’와 ‘지방행정데이터(http://localdata.kr)’ 포털 사이트를 소개했다. 두 사이트는 표준화된 포맷의 공공데이터를 제공한다.

이날은 데이터 저널리즘의 한계에 대한 언급도 있었다. 그러나 데이터 저널리즘은 ‘무엇을 어떻게 다루느냐’에 따라 저널리즘의 미래가 될 수 있다. 자료상의 점과 수치가 실제 현실의 ‘무언가’를 나타내고 있다는 데이터의 본질을 기억해야 한다. 정보공개청구를 통해 정보 창고를 내 것으로 만들 수도 있다. 데이터 저널리즘 구현을 위한 기술 환경 개선, 개발자와의 협업 노력도 언론사 차원에서 필요하다. 저널리즘이 독자를 위해 ‘무엇을 어떻게 다룰 것인지’를 명확히 한다면 데이터 저널리즘은 언론의 지평을 확대하는 유용한 방법이 될 것이다.


저작권자 © 미디어오늘 무단전재 및 재배포 금지