얼마 전 여성단체 활동가들과 만날 기회가 있었습니다. 그날 테이블에 오른 주제는 최근 S모 사이트 같은 불법 몰카 사이트로부터 스스로를 보호하는 법이었습니다. 그러던 중 한 활동가가 흥미로운 얘기를 들려주었습니다. 구글에 한글로 ‘길거리’라고 검색하면 길거리에서 찍은 일반인 여성 몰래카메라 사진이 나오고, 길거리를 영어로 써서 ‘street’라고 검색하면 진짜 사람이 다니는 길거리 사진이 나온다는 겁니다. 그만큼 일상생활에서 몰카가 많이 찍히고 있다는 대화였지만 정말 그런지 궁금해서 실제로 해봤습니다.

구글 검색창에 ‘길거리’를 입력하니 관련 이미지로 주로 노출이 많은 옷을 입은 여성들의 사진이 화면을 가득 채웠습니다. 그 다음 ‘street’로 검색하니 각종 거리 사진이 나왔습니다. 같은 뜻을 가리키는 단어라도 한글, 영어 차이에 따라 검색 결과가 달라지는 것은 ‘길거리’ 뿐이 아니었습니다. ‘여동생’이라고 치니 보기에도 민망한 페이지가 펼쳐졌습니다. 노출이 많은 옷을 입고 편한 자세를 취하고 있는 여성들의 사진이 주로 나왔습니다. 진짜 몰카처럼 보이는 사진과 일부러 선정적인 테마로 연출한 사진이 섞여 있었습니다. 그런데 이를 영어로 바꿔 ‘younger sister’라고 치면 흔히 ‘여동생’에서 연상되는 사랑스러운 여자 아이들의 사진이 나왔습니다. 이는 ‘누나’와 ‘older sister’도 마찬가지였습니다. ‘민소매’라고만 쳐도 노출 수위가 높은 여성들의 사진이 나왔습니다. 예상하시다시피 물론 ‘sleeveless’를 입력하면 진짜 민소매 옷 이미지가 주로 나왔고요. 뭘 검색해야 여성 사진이 나오지 않을지 궁금해질 정도였습니다. 

 

   
▲ (위) 구글에 '길거리'를 검색했을 경우 (아래) 구글에 'street'를 검색했을 경우.
 

구글 검색을 이용하는 한국 이용자들이 유독 길거리, 여동생, 민소매 같은 키워드에 성적인 의미를 부여하는 것인지, 그렇다면 왜 똑같이 이미지 검색을 제공하는 네이버와 다음에서는 이 같은 결과가 나오지 않는지 궁금해졌습니다. 그래서 구글코리아에 연락해봤습니다. 한국에는 대답해줄만한 부서가 없고, PR팀이 확인해 답이 가능하다면 해주겠다는 모호한 답이 돌아왔습니다. 네이버와 다음 관계자에게도 왜 이런 차이가 나오는지 물어봤지만 역시 검색 알고리즘은 영업 비밀이라 설명해줄 수 없다는 대답이 돌아왔습니다. 

 

   
▲ (위)'민소매'를 구글 검색했을 때 (아래)'sleeveless'를 검색했을 때.
 

그래서 전문가에게 물어봤습니다. ‘당신을 공유하시겠습니까?(도서출판 어크로스)’, ‘인터넷에서는 무엇이 뉴스가 되나’(도서출판 커뮤니케이션북스)의 저자이자 ‘잊혀질 권리’(도서출판 지식의 날개)를 번역한 구본권 사람과 디지털 연구소 소장은 이렇게 답했습니다. 

“구글은 검색 알고리즘에 사람을 투입하는 구조가 아닙니다. 기본 검색엔진을 기계로 알고리즘화 합니다. 어디에서 ‘부적절한 검색이다’라고 문제제기나 신고가 오면 그것에 기반해서 자동으로 결과에서 배제시키는 식이죠. 그래서 구글 검색엔진은 사용자 데이터베이스가 많고 사용자의 피드백이 많은 주요 언어부터 잘 만들어질 수밖에 없습니다. 전 세계 영어권 이용자를 상대로 한 검색 엔진 퀄리티가 상당히 높을 수밖에 없는 이유죠. 그래서 전 세계 이용자로부터 일어나는 피드백은 대단히 정교한 부분까지 가 있습니다.

그런데 한국에서는 구글의 한글 이용자도 많지 않고 그러다 보니 신고도 많이 하지 않는 거죠. 그래서 구글이 10만 건의 데이터를 가지고 있을 때와 150건의 데이터를 가지고 있을 때하고 날 수밖에 없는 겁니다. 한국에서 어떤 큰 문제가 됐을 때는 구글이 수동으로 블라인드처리하고 자료를 지울 때도 있지만 그런 경우는 지극히 일부에 불과합니다. 결국은 사용자의 수, 언어 특성과 관련된 것이라고 보면 됩니다.“

이어 구 소장은 “네이버나 다음은 국내 사업자니까 국내법의 규제를 받기 때문에 아무래도 사람이 투입돼 민감하게 필터링같은 부분을 관리하기 때문에 부적절한 검색 결과가 덜 나온다”고 덧붙였습니다.

결국 사용자 수와 검색결과에 대한 피드백과 밀접한 관련이 있을 가능성이 높다는 겁니다. 물론 구글의 검색 알고리즘은 철저히 비밀로 취급되기 때문에 구 소장의 말이 모두 맞다는 것은 아닙니다.

포털업계에 따르면 지난해 11월말 기준 국내 PC 검색 점유율은 네이버가 77.41%로 부동의 1위를 지키고 있고 다음카카오(18.69%), 구글코리아(1.85%) 순으로 구글 PC 검색은 좀처럼 힘을 쓰지 못합니다. 하지만 지난 1월 기준 닐슨코리아 자료에 따르면 모바일 검색 점유율은 네이버(76.7%)에 이어 구글(12.2%)이 2위를 차지했습니다. 다음카카오(11.1%)를 앞지른 셈이죠. 구글검색이 안드로이드폰에 선탑재된 영향이라고 합니다. 검색 시장에서 점점 영향력을 높여가는 만큼 구글에도 조금은 사용자를 배려한 검색 정책이 필요하지 않을까요?   

      

 

저작권자 © 미디어오늘 무단전재 및 재배포 금지