
번역AI가 수도방위사령부를 ‘water defense command’로, 비명계를 ‘screaming world’로 번역한 결과를 지난 1월 YTN이 영문 홈페이지에 그대로 게재해 논란이 됐다. YTN이 결과물을 검수하지 않은 것도 문제였지만, 생성형AI가 한국어 고유명사를 제대로 이해하지 못했다는 한계도 확인됐다. 이와 관련 김자현 업스테이지 사업개발 리드는 한국어 문맥을 이해할 수 있는 생성형AI를 미디어 기업에 도입해야 한다고 밝혔다.
김자현 업스테이지 사업개발 리드는 3일 서울 강남구 과학기술컨벤션센터 국제회의실에서 미디어오늘이 주최한 ‘2025 미디어의 미래 컨퍼런스’에서 <AI Driven Media: 일의 미래를 바꾸는 생성형AI의 힘>이라는 주제로 발표를 진행했다. AI 스타트업 업스테이지는 최근 네이버 클라우드·SK텔레콤·NC AI·LG AI연구원과 함께 ‘독자 AI 파운데이션 모델’ 구축을 위한 국가대표 AI 기업으로 선정됐으며, 지난 2월부터 조선일보와 업무협약을 맺는 등 미디어 기업이 활용할 수 있는 AI를 개발하고 있다.
업스테이지의 교열AI는 조선일보에서 활용되고 있으며, 번역AI를 통해 조선일보 기사를 영문으로 번역해 별도 홈페이지에서 제공된다. 김자현 리드는 “미디어 기업은 AI가 단순히 업무를 도와주는 차원이 아니라. 인간 수준의 일을 해주길 기대한다. 또 효율성보다는 신뢰성을 강조하는 부분도 있다”며 “모든 언론사는 자사 기사를 영어로 번역하고자 하는 니즈가 있는데, (조선일보에 도입한 번역AI는) 번역을 잘하는 것을 넘어 기사라는 형식에 맞는 번역을 하고 있다”고 설명했다.
업스테이지 번역AI는 기사에 주로 활용되는 단어는 별도로 분류해 직역으로 인한 오류를 사전에 막는다. ‘수도방위사령부’가 대표적이다. YTN은 영문 사이트에서 수도방위사령부를 직역해 ‘water defense command’로 번역했다. 수도를 서울이 아닌 ‘물’로 해석한 것이다. 하지만 업스테이지 AI는 수도방위사령부를 ‘CDC(Capital Defense Command)’로 번역하도록 설정하고 있다. 이처럼 직역 시 문제가 생길 수 있는 단어를 별도로 관리하는 것이다.

기사 제목도 문맥에 맞춰 새롭게 만들어진다. 김자현 리드는 “한글 제목을 단순히 직역하면 길이가 길어지는 현상이 발생한다. 이에 기존 한글 제목과 이를 번역한 영문 제목을 바탕으로 새로운 제목을 생성한다”고 설명했다.
일례로 조선일보의 3일자 기사 제목 <푸틴 “北, 쿠르스크 해방 도와” 김정은 “형제의 의무”>를 번역AI 딥엘에서 영어로 번역하면 Putin “North Korea helped liberate Kursk” Kim Jong-un “A brother's duty”라는 결과가 나온다. 업스테이지 AI는 이를 Putin praises North Korea's Kursk role, Kim vows support로 번역했다. 의미는 그대로 전달됐지만 제목 길이는 짧아졌다.
조선일보 3일자 사설 <돈 풀기와 노동뿐, ‘성장’ 안 보인 ‘성장 회의’>에선 업스테이지 AI의 강점이 잘 드러난다. 업스테이지 AI는 이 제목을 Growth meeting focuses on spending, labor, not growth로 번역했다. 하지만 딥엘은 이 제목을 Money and labor alone, no ‘growth’ in sight: ‘Growth skepticism’로 번역했는데, ‘회의’(meeting)를 ‘회의론’(skepticism)으로 오번역했다. 구글 번역 결과는 A ‘growth conference’ focused solely on loosening money and labor, with no ‘growth’ in sight로 오번역은 없었지만 기사 제목이 길다.

교열에서도 문맥을 고려한다. 김자현 리드는 “기존 맞춤법 검사기는 오탈자 검수 측면에서 매우 정확하지만 이용률은 떨어진다. 너무 많은 선택지를 제공해 시간이 오래 걸리기 때문”이라며 “업스테이지는 문맥 학습을 통해 일반적인 맞춤법 검사기와 다른 모습을 보인다”고 했다.
예컨대 네이버·다음 맞춤법 검사기에 “2조6000억 달러(약 3619원)”을 입력하면 문제가 없다는 답이 돌아온다. 하지만 업스테이지가 조선일보에 제공하고 있는 AI는 2조6000억 달러가 3619원이 아니라 3619조 원이라는 점을 짚어낸다.
김자현 리드는 업스테이지의 생성형AI ‘솔라 프로2’의 한국어 학습량이 많기에 국내 미디어 기업에 특화된 AI 서비스를 출시할 수 있었다고 밝혔다. 김 리드는 “솔라 프로2가 학습한 데이터는 한국어와 관련된 것이 많기에 더 좋은 방향성을 가져갈 수 있다. 미디어 시장에서 더 좋은 성능을 낼 것”이라고 밝혔다.
관련기사
업스테이지의 목표는 모든 미디어 기업이 적용할 수 있는 AI 도구 개발이다. 김자현 리드는 “업스테이지가 조선일보와 MOU를 진행하고 과제를 수행하고 있지만, 조선일보에 특화된 모델은 많지 않다. 다른 언론사도 적용할 수 있는 서비스를 구현하고 있다”며 “번역·교열AI 역시 조선일보뿐 아니라 다른 미디어 기업도 도입할 수 있는 상황”이라고 했다. 김 리드는 “대형 미디어 기업뿐 아니라 1인 출판사에도 서비스를 제공하고 있다”고 했다.
김자현 리드는 팩트체크와 기사 생성을 다음 목표로 꼽았다. 김 리드는 “팩트체크를 위해선 데이터가 있어야 하는데, 이 판단이 어렵다”며 “팩트체크와 기사 생성을 미디어 분야에서 어떻게 해석할 수 있을지 과제를 수행 중”이라고 했다.
후원은 더 좋은 기사에 도움이 됩니다
