“구글의 알고리즘 공개를 보면 15개 항목이 상세하게 있는 데 반해 네이버의 알고리즘은 추상적으로 되어 있다.”

박성중 대통령직인수위원회 과학기술교육분과 간사가 지난 2일 포털 정책을 발표하며 한 말이다. 박성중 간사는 네이버 등 포털의 뉴스알고리즘이 투명하지 않다며 포털 내 알고리즘검증기구 설치를 강제하는 정책을 제시했다.

▲ 대통령직인수위원회 과학기술교육분과 박성중 간사의 브리핑 모습
▲ 대통령직인수위원회 과학기술교육분과 박성중 간사의 브리핑 모습

구글이 뉴스 알고리즘을 구체적으로 제시하고 있다는 주장은 박성중 간사 발언 뿐 아니라 국내 언론 등에서도 확인된다. 실제 구글은 뉴스 기사 순위 책정을 위한 13가지 요인을 밝히고 있다. 또한 구글은 ‘더 트러스트 프로젝트’를 통해 신뢰할 수 있는 정보를 검색 결과에 뜨도록 추진한 바 있고, 뉴스 알고리즘 관련 주요 변경 사항 일부를 공지를 통해 밝히기도 했다.

‘구글의 뉴스 기사 평가 기준 13가지’는 △ 뉴스 작성 언론사의 기사 생산량 △ 기사의 길이 △ 보도의 중요성 △ 속보성 △ 뉴스 검색 이용 패턴 △ 언론사에 대한 여론 조사 △ 수용자 수 및 트래픽 △ 뉴스 작성 언론사의 뉴스룸 크기 △ 뉴스 작성 언론사의 지국 수 △ 실명 인용 보도의 수 △ 뉴스 작성 언론사의 보도 범위 △ 보도 기사의 글로벌 도달률△ 글쓰기 스타일 등이다.

▲ 구글 뉴스배열 설명 기준 페이지(2022년 현재)
▲ 구글 뉴스배열 설명 기준 페이지(2022년 현재)

[구글의 뉴스배열 기준(검색 결과)]

이 같은 내용이 언론 등을 통해 확산되며 ‘구글은 알고리즘 배열 기준을 투명하게 공개한다’는 인식이 자리 잡게 됐다. 2015년 KBS는 “(구글이) 자세한 비중은 공개하고 있지 않습니다만, 기사 내용과 언론사의 신뢰도를 함께 고려하도록 되어 있습니다. 이 기준을 바탕으로 뉴스를 기계적으로 배치하기 때문에 논란을 줄일 수 있는 겁니다”라며 네이버와 비교했다. 

당시 네이버는 뉴스배열 원칙에 대해 △다양한 정보를 신속하고 정확하게 전달 △균형 잡힌 정보 △사회적 공익 가치 존중 △이용자와 쌍방향 소통 구현 △개인 인격권 보호 정도로만 설명했다. ‘균형 잡인 정보’와 ‘공익 가치’가 무엇인지, 어떻게 구현하는지 불분명하다. 당시 기준으로 보면 ‘구글보다 네이버가 알고리즘 공개에 소극적’이라는 평가가 가능하다.

하지만 현재 시점에선 ‘구글 뉴스 알고리즘이 더 투명하다’는 명제는 유효하지 않다. 네이버가 지난해부터 뉴스 알고리즘에 대한 발표를 하면서 현재 시점에선 네이버가 구글보다 알고리즘을 구체적으로 설명하고 있다.

▲ 네이버 뉴스배열 알고리즘 설명 QnA 페이지 일부
▲ 네이버 뉴스배열 알고리즘 설명 QnA 페이지 일부

지난해 7월 네이버는 공식 블로그를 통해 알고리즘에 대한 구체적인 설명을 시작했다. △ 알고리즘 추천이 이뤄지는 영역 △ 기사 품질 판단 기준 △ 기획/심층 기사가 제대로 노출되지 않는다는 지적 △ 정치적 불공정 논란 등에 구체적 수식과 함께 대중적 용어로 풀어 ‘QnA’를 제작했다.

일례로 네이버는 기사의 질을 판단하기 위해 기사 제목, 본문, 기자 정보(바이라인 유무), 섹션 정보(기사 내용에 걸맞은 섹션 배정을 했는지) 등을 살피고, 최근 2주간 읽은 기사를 기반으로, 같은 기사를 읽은 다른 사용자가 많이 소비한 기사를 주로 추천한다고 밝혔다. 또한 네이버는 현실적으로 알고리즘이 심층 기사를 판단하는 기준이 불분명하다며 알고리즘의 한계를 인정했다.

[네이버 뉴스배열 알고리즘 설명 QnA 페이지]
[네이버 알고리즘 검토 결과 설명 페이지]

▲ 네이버 뉴스배열 알고리즘 작동방식 설명 페이지 일부
▲ 네이버 뉴스배열 알고리즘 작동방식 설명 페이지 일부

2022년 1월 네이버는 알고리즘 검토위원회를 통한 외부 검증을 받은 결과를 공개하기도 했다. 검토 결과 네이버 뉴스 알고리즘은 송고된 기사 수, 송고 시점 및 기사의 생산을 고려하기에 대규모 언론사를 우대하는 경향을 확인했다. 검토위원회는 “당시의 주류 논조를 벗어나는 담론을 담고 있는 기사, 심도 있는 기사는 자동화된 검색 결과로서는 탐색되기 어려운 것을 확인했다”고 지적하기도 했다.

‘알고리즘의 블랙박스’의 저자이자 포털 알고리즘의 불투명성을 비판해온 오세욱 한국언론진흥재단 책임연구위원은 지난해 12월 미디어오늘과 인터뷰에서 “네이버가 최근 공개한 알고리즘 작동 원리가 솔직하다고 생각한다”고 평가했다. 그는 “그간 포털을 지적했던 이유는 '알고리즘의 한계'를 인정하지 않고 '알고리즘으로 하니 문제 없다'는 태도를 보였기 때문이다. 이전부터 포털이 알고리즘 한계를 인정하기를 원했다. 한계를 인정해야 이후 어떻게 할지 논의할 수 있기 때문”이라고 밝혔다.

또 하나 살펴볼 대목은 ‘구글이 뉴스 알고리즘 투명성’을 갖게 된 계기다. 구글은 2012년 자사 뉴스 알고리즘 특허를 냈고, 이 과정에서 관련 내용이 공개된 것이다. 더구나 공개 이후 오랜 기간이 지나면서 많은 변화가 있었지만 괄목할 만큼 구체적인 내용을 추가로 제시하지는 않고 있다.

즉, 구글의 알고리즘 설명이 선제적이었던 건 사실이지만 2022년 기준에서 보면 네이버의 뉴스 알고리즘 설명이 구글과 비교하기 힘들 정도로 구체적으로 변화했다. 특히 ‘알고리즘의 한계’를 밝힌 대목은 카카오, 구글 등 다른 사업자와 비교해도 모범적이라고 할 수 있다.

그렇다고 네이버의 알고리즘 설명이 이상적이라고만은 볼 수 없다. 네이버는 ‘공식 블로그’를 통해 관련 내용을 공개했는데, 이를 전면적 공개로 볼 수 있을지는 의문이다. 별도의 페이지를 구성해 네이버 메인이나 뉴스면 등에 적극 노출하지는 않아 적극성이 부족하다는 지적이 가능하다.

네이버가 자발적으로 뉴스 알고리즘의 원리를 설명하지 않은 점도 짚을 필요가 있다. 전부터 네이버 등 포털의 알고리즘 설명이 구체적이어야 한다는 지적이 끊이지 않았다. 그러나 이를 수용하지 않던 네이버가 지난해 MBC ‘스트레이트’가 네이버 알고리즘이 보수 언론에 편향적이라는 취지의 보도를 한 이후 정치권에서 규제 논의가 이어지자 뉴스 알고리즘 원리를 설명하기 시작했다는 점도 복기할 필요가 있다.

저작권자 © 미디어오늘 무단전재 및 재배포 금지