네이버, 검색 결과에 그 언론이 뜨는 이유 공개했다
네이버, 검색 결과에 그 언론이 뜨는 이유 공개했다
네이버 알고리즘 공개 이어, 검색 결과 ‘관련도순’ 배열 기준 공개... 제목 길이·멀티미디어 요소·광고·다른 언론이 다룬 이슈인지 등 반영

포털 네이버에서 특정 단어를 검색하면 4건 정도의 기사 묶음이 뜬다. ‘올림픽’처럼 사회적으로 관심이 높은 단어를 검색했을 때 뜨는 기사는 많은 사람들이 클릭할 수밖에 없다. 이 기준은 어떻게 정하는 걸까?

네이버가 공식 블로그를 통해 뉴스 추천 알고리즘 작동방식과 Q&A를 공개한 데 이어 검색 결과 상단에 뜨는 기준에 대해서도 구체적인 설명과 Q&A를 공개했다. 네이버는 “그동안 ‘관련도순’ 배열 결과에 대해 가장 많이 접수된 문의 내용을 Q&A로 재구성하여 좀 더 이해하기 쉽게 설명드리겠다”고 했다. ‘관련도순’은 포털 검색시 기본적으로 뜨는 정렬 방식을 말한다.

[관련기사: "왜 보수 언론이 많이 뜨나요?" 의문에 응답한 네이버]

언론사에 따라 ‘등급’을 정하고 특정 언론사를 더 많이 노출하는 것 아니냐는 지적에 네이버는 “언론사별로 임의로 설정한 값은 없다”면서도 ‘기사’와 ‘언론’에 대해 수시로 평가를 하며 이를 반영한다고 밝혔다.

▲ ⓒ gettyimagesbank
▲ ⓒ gettyimagesbank

네이버의 설명을 종합하면 네이버가 검색 결과 상단에 거는 기사의 기준은 △선정적인 제목을 쓰지 않고 △내용이 가십성이 아니고 △제목이 지나치게 길지 않고 △기자의 이름이 분명히 드러나 있고 △이미지, 동영상 등 멀티미디어 요소가 많고 △웹 분석 결과 해당 언론사가 영향력과 인용 등에서 긍정적인 평가를 받고 있고 △클릭한 결과 접속되는 언론사 홈페이지에 편의성을 해치는 과도한 광고가 없고 △다른 언론사보다 클러스터(기사 묶음)에 들어간 기사가 많고 △같은 클러스터에 묶인 다른 언론사의 기사보다 품질이 높아야 한다.

네이버는 ‘신뢰도 기준’과 관련 “실시간 급상승 검색어(실검)에 대한 저품질 기사 생산 양식을 추출해 신뢰도 점수로 활용해 왔다”며 “현재는 급상승 검색어 서비스가 종료돼 해당 패널티가 적용되지는 않고 있다. 다만 새로운 기준으로 저품질 기사 생산 점수를 추출하여 검토 중에 있으며 기준이 마련되는 대로 해당 패널티는 다시 반영할 예정”이라고 했다.

네이버는 ‘클러스터’ 상단에 뜨는 기준에 대해 “특정 언론사가 클러스터의 대표 기사를 독점하지 못하도록 방어해주는 로직이 있다”며 “특정 언론사의 기사가 상위 클러스터의 대표기사로 노출된 경우 다음 클러스터에서는 다른 언론사의 후순위 기사를 대표기사로 노출하고 있다”고 설명했다. ‘클러스터’는 유사한 기사를 묶음 형태로 제공하는 것을 말하는데 클러스터 상단에 뜨면 많은 접속을 유도할 수 있다. 

▲ 네이버 검색 결과 클러스터 예시. 상단에 한 기사가 뜨고, 같은 사안을 다룬 다른 기사는 '묶음' 형태로 제공한다
▲ 네이버 검색 결과 클러스터 예시. 상단에 한 기사가 뜨고, 같은 사안을 다룬 다른 기사는 '묶음' 형태로 제공한다

네이버는 클러스터에 묶인 기사가 더 빈번하게 검색 결과에 뜨는 이유에 대해 “다양한 언론사들이 비슷한 내용으로 보도한 기사들이 많다는 것은 해당 클러스터의 기사들이 이슈에 대해 가장 핵심적인 내용을 담고 있을 확률이 높다는 것을 의미할 가능성이 높다”며 “클러스터 내 기사 개수가 많으면 관련도 점수에 가점을 받고 있다”고 했다.

조회수가 높은 기사가 검색 상단에 뜨는 것 아니냐는 지적에 네이버는 “자극적인 제목이나 이미지를 사용한 기사들이 상대적으로 사용자의 클릭이 높아지는 등 클릭량이 검색 품질에 부정적인 영향을 끼치는 부분이 있어 현재 클릭량 정보를 직접적으로 사용하지는 않는다”고 밝혔다.

언론계는 제목에 ‘단독’ 말머리를 붙이면 네이버가 검색 결과 상단에 노출할 가능성이 높다는 분석을 내놓고 있다. 이와 관련 네이버는 “추출한 말머리 신뢰도에 따라 가점을 받을 수 있고, 감점을 받을 수도 있다. 또한 모든 기사의 말머리가 가점을 받는 것은 아니다”라며 저질기사에 말머리를 남발할 경우 오히려 불이익이 있을 수 있다는 입장이다.

또한 네이버는 특정 언론, 기자에 대한 구독 여부가 뉴스 검색 결과에 뜨는 배열에 영향을 미치지는 않는다고 했다. 네이버는 “뉴스 검색에 제휴된 언론사는 메인 등 네이버 뉴스 서비스에 제휴된 언론사와 동일하지 않다”며 “언론사의 구독 및 많이 본 언론사 정보는 ‘뉴스 제휴’ 언론사만을 대상으로 하기 때문에 ‘검색 제휴’ 언론사와의 형평성을 위해 사용할 수 없는 값”이라고 설명했다. 

포털 검색 결과에는 구독 서비스를 제공하는 콘텐츠 제휴 매체 뿐 아니라 검색 결과에만 뜨는 ‘검색 제휴’매체도 있기 때문에 구독과 관련한 요소는 반영하지 않는다는 얘기다.

앞서 네이버는 지난 21일 개인 맞춤형 뉴스 추천 알고리즘 에어스의 작동방식을 공개했다. 네이버는 언론사의 심층 기사는 잘 보이지 않고, 속보나 온라인 이슈에 대응하는 기사가 많이 보인다는 지적에 “기본적으로 클릭이 많이 발생한 기사가 추천될 확률이 높아진다”며 “여러 언론사가 함께 다루는 주제가 사회적 관심이 크다고 가정, 뉴스 클러스터(추천 후보군인 유사 기사 묶음)에 속한 기사에 가산점을 부여한다”고 밝혔다.

네이버 뉴스 추천 알고리즘과 검색 결과 배열 원리 모두 ‘다른 언론사들이 함께 다룬 이슈’에 가중치를 둔다는 공통점이 있다. 즉 사회적 관심사가 높은 이슈를 쓰는 언론사가 우대 받는 것인데 이는 알맹이 없는 가십성 기사 등 ‘온라인 실시간 대응’을 부추긴다는 지적을 피하기 힘들다.

이 기사를 후원합니다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 2
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
한나라 2021-07-30 21:45:35
왜자꾸 쓰레기를 버리느냐는 질문에 환경을 위해 쓰레기를 버리지 맙시다라는 답을 하다니.

졸리 2021-07-30 18:13:46
네이버의 설명을 종합하면 네이버가 검색 결과 상단에 거는 기사의 기준은 △선정적인 제목을 쓰지 않고 △내용이 가십성이 아니고 △웹 분석 결과 해당 언론사가 영향력과 인용 등에서 긍정적인 평가를 받고 있고 △클릭한 결과 접속되는 언론사 홈페이지에 편의성을 해치는 과도한 광고가 없고 △다른 언론사보다 클러스터(기사 묶음)에 들어간 기사가 많고 △같은 클러스터에 묶인 다른 언론사의 기사보다 품질이 높아야 한다. <- 이 대목에서 웃으면 되나요?