언론과 네이버가 또다시 격돌했다. 그간 크고 작은 갈등이 이어졌지만 ‘인공지능 시대’를 앞두고 ‘뉴스 데이터 학습’을 쟁점으로 벌어진 첫 갈등 사례다. 언론은 ‘인공지능 기술 전환기’마저 뉴스를 헐값에 넘기면 안 된다는 위기감이 크다. 현실적으로 한국 언론의 자본력에 한계가 있기에 기술 기업과 협력을 통해 ‘윈윈’하는 방법을 모색해야 한다는 지적도 있다.

일방적 약관 개정에 언론 집단 반발

주요 종합일간지와 경제지 등을 회원사로 둔 한국온라인신문협회(온신협)는 최근 네이버에 의견서를 내고 네이버가 언론에 통보한 ‘뉴스콘텐츠제휴 약관 개정안’을 비판했다. 지난 12일 한국신문방송편집인협회·한국기자협회·한국여성기자협회·한국인터넷신문협회도 공동입장을 내고 네이버를 비판했다.

약관 개정안 가운데 ‘네이버는 서비스 개선, 새로운 서비스 개발을 위한 연구를 위해 직접, 공동으로 또는 제3자에게 위탁하는 방식으로 정보를 이용할 수 있다’는 조항이 쟁점이 됐다. 네이버가 서비스 개발과 연구를 위해 ‘계열사’에 뉴스 정보를 언론 동의 없이 넘길 수 있다는 내용이다.

▲ 사진=Getty Images Bank
▲ 사진=Getty Images Bank

온신협은 의견서를 통해 “통상적인 정보의 활용 범위를 벗어나는 불공정 계약”이라며 “뉴스 서비스 외에 정보를 활용하는 부분은 언론사에 사전 동의를 구해야 한다”고 했다. 지난 13일 온신협은 네이버와 간담회를 했고 네이버는 별도의 동의를 받겠다고 한발 물러서며 갈등은 일단락됐다.

본질은 인공지능 학습 뉴스데이터 둘러싼 갈등

챗GPT로 대표되는 생성형 인공지능이 화두가 된 상황에서 언론과 플랫폼 간 뉴스 정보를 둘러싼 국내 첫 갈등 사례다.

언론사들은 네이버가 자체 인공지능 개발 과정에서 뉴스 데이터를 학습시키는 데 뉴스 정보를 활용할 것이라고 추정한다. 인공지능 학습을 위해 다량의 정보가 필요한데 사실 확인을 거쳐 만든 언론의 뉴스는 양질의 콘텐츠로 꼽힌다. 실제 네이버는 자사 인공지능 모델 ‘하이퍼클로바’를 개발하고 있고 올해 마이크로소프트와 마찬가지로 챗GPT와 같은 생성형 인공지능을 탑재한 검색 서비스를 출시할 계획이다.

이준환 서울대 언론정보학과 교수는 “언론 기사는 양질의 콘텐츠다. 활용 가치가 크다. 인공지능 팩트체크에 있어서도 좋은 소스가 된다”며 “활용에 있어 여러 이슈가 있겠지만 언론기사는 매우 중요한 AI 학습자료”라고 설명했다.

언론사 관계자들도 이 점을 염두에 두고 대응에 나섰다. A언론사 디지털 부문 관계자는 “기사는 정제된 텍스트이고, 어느 정도 사실에 부합한다”며 “뉴스가 과거에는 정보 전달의 도구였는데 지금은 정제된 데이터로서 가치를 인정받고 있다. 시대에 맞게 (계약 조건도) 다시 논의해야 한다”고 했다.

▲ 디자인=이우림 기자
▲ 디자인=이우림 기자

네이버가 ‘활용 범위’를 모호하게 적시한 대목도 논란이 됐다. B언론사 디지털 부문 관계자는 “문제는 포털이 우리 데이터를 쓰는지 확인이 안 된다는 점”이라며 “기본적으로 뉴스 제공에 따른 대가를 받고 있지만 향후 인공지능에 활용하려면 별도로 동의를 구하는 게 맞다”고 했다.

C언론사 관계자 역시 “챗GPT 시대라는 게 중요하다. 어떻게 사용될지 청사진이 그려지지 않은 상황에서 기술이 앞선 포털이 이용하겠다고 했을 때 매듭을 잘 지어놓지 않으면 나중에는 방법이 없어진다”며 “과거 인터넷 뉴스가 처음 나왔을 때 포털이 기사를 어떻게 활용할지 몰라 언론이 염가에 넘긴 것”이라고 했다. 이 관계자는 “실험료를 낸다든가, 이 과정에서 소통하겠다고 했으면 논란이 되지 않았을 것”이라며 “‘약관에 넣겠으니 토 달지 말라는 식’은 문제가 된다. 대학 등 기관에서도 뉴스를 활용해 머신러닝 연구를 할 때 공문을 보낸다”고 했다.

미국에서도 뉴스 인공지능 학습 쟁점

미국에선 이미 생성형 인공지능의 뉴스 무단 사용이 논란이 됐다. 챗GPT 개발사인 오픈AI가 미국의 주요 언론사 뉴스를 학습한 정황이 드러나자 CNN과 월스트리트저널이 법적 대응을 검토하겠다고 밝혔다.

월스트리트저널을 소유한 다우존스앤컴퍼니의 법률대리인은 지난 2월 “월스트리트저널 기자들이 쓴 기사를 AI를 학습시키는 데 활용하고자 하는 이들은 누구든 적절한 라이선스를 받아야 한다”고 밝혔다. 지난 2월 블룸버그에 따르면 CNN 관계자는 “CNN은 자사의 기사를 챗GPT에 훈련시키기 위해 사용하는 것이 약관 위반이라고 생각한다”고 밝혔다.

미국과 캐나다 언론사들이 가입된 뉴스미디어연합(NMA) 차원에서도 인공지능의 무단 뉴스 학습에 관한 논의가 이어졌다. 대니얼 코피 NMA 부회장은 “우리가 투자를 해 만든 가치 있는 콘텐츠에는 인간의 노력을 필요로 하지만 이를 다른 사람들이 무단으로 사용하고 있다”며 “보상을 받아야 한다”고 했다.

실제 소송이 진행되면 ‘공정이용’ 여부가 쟁점이 될 전망이다. ‘공정이용’은 저작권법 적용의 예외 조항을 말한다. 인공지능 ‘학습’은 저작물을 갖다 쓴 게 아니라 사람이 도서관에서 공부를 위해 책을 빌린 것과 유사한 개념이라는 게 오픈AI측의 기존 입장이다. 다만 오픈AI측이 “특정 분야의 매우 품질이 높은 데이터에 대해서는 지불할 의향이 있다”는 입장을 밝히기도 했다. 언론의 법적 대응이 이어질 경우 협의를 통해 대가 보상을 할 가능성이 있다.

언론은 무엇을 준비해야 하나

인공지능이 뉴스 학습을 필요로 하는 상황에서 언론은 ‘대가 협상’뿐 아니라 장기적인 준비를 해야 할 시점이기도 하다.

C언론사 디지털 부문 관계자는 언론의 독자적 개발이 필요하다고 밝혔다. 이 관계자는 “언론사들이 모바일 공간에서 뉴스가 소비되는 시대를 맞이하면서 합당하게 투자나 노력을 했나”라며 “우리도 조직 DNA를 다듬어야 한다. 언론이 기술 시대에 적응을 하지 못하고 유통 파워를 빼앗기니 이런 일이 생긴 것”이라고 했다. 그러면서 “언론사들이 그동안 수익금으로 기술 개발에 투자를 했어야 하는데, 그러지 않은 것도 문제”라고 했다.

반면 포털을 ‘활용’해야 한다고 보는 시선도 있다. B언론사 관계자는 “포털이 협의를 해서 여러 기술들을 이관하겠다고 밝혔다”며 “그렇다면 포털의 (인공지능) 개발물을 우리가 쓸 수 있도록 해야 한다. 포털이 방대한 데이터를 갖고 서비스를 개발하면 언론사들이 이를 토대로 독자 대상 서비스나 유료화에 활용할 수 있다”고 했다.

이준환 교수는 “콘텐츠를 제공한 쪽과 기술을 가진 쪽이 협력해 콘텐츠를 제공하고 개발했으면 그 서비스를 활용할 수 있는 기회가 적극적으로 주어져야 한다”며 “언론과 기술이 대규모로 협력해야 할 시점이 온 거다. 여러 언론사와 IT기업 사이에 조인트벤처가 만들어질 수 있는 기회라고 생각한다. 협력 모델을 찾는 게 맞는 것 같다”고 했다.

이성규 미디어스피어 대표는 “기술적 전환기에 기회가 생기는데 현실적으로 한국 언론은 독자적인 서비스를 만들 정도의 재무적 여건이 된다고 보기 어렵다. 그렇다면 기술 가진 쪽과 협업해 가치를 높여나가는 게 불가피하다”며 “대등한 협업의 관계를 재구축하는 기회로 삼으면 좋겠다”고 했다.

이성규 대표는 “언론사들은 자신들의 데이터로 무엇을 할 것인지 명확한 상이 그려져야 한다. 데이터를 단순히 모아놓는 게 아니라 학습이 가능한 방식으로 구축하는 작업이 필요하다”며 “또한 단순 팩트 나열 기사는 공정이용(저작권상 예외조항)으로 판단할 여지가 있다”며 “저작물로 인정을 받으려면 창의적 표현이 필요하다. 언론이 몸값을 높이려면 분석과 해설, 관점이 들어간 유형의 보도가 받쳐줄 필요가 있다”고 했다.

저작권자 © 미디어오늘 무단전재 및 재배포 금지