▲ 오픈AI 소라 시연영상 갈무리
▲ 오픈AI 소라 시연영상을 움직이는 이미지로 편집한 버전. 실제 영상은 10초 분량이고 프레임도 더 높다.  

매머드가 눈 위를 달리는 영상은 영화의 한 장면을 방불케 한다.

이 영상은 챗GPT 개발사인 오픈AI가 15일(현지시간) 공개한 텍스트를 동영상으로 만들어주는 인공지능(AI) 시스템 ‘소라’(Sora)의 시연 버전을 통해 제작됐다. 글과 이미지를 생성하는 AI에 이어 영상 제작 AI까지 뛰어난 성능을 보인 것이다. 

소라의 특징은?

매머드 영상은 “몇 마리의 거대한 털북숭이 매머드들이 눈 덮인 초원을 밟으며 다가오고 있고, 그들의 긴 털은 걸을 때 바람에 가볍게 흔들리고, 멀리 눈 덮인 나무와 극적인 모습의 눈 덮인 산, 위풍당당한 구름이 있고 멀리 높은 태양이 따뜻한 빛을 낸다”는 내용이 담긴 문장을 입력했을 때 만들어낸 결과물이다. 

▲ 소라 서비스에서 거리를 걷는 여성을 입력했을 때 나오는 영상의 한 장면.
▲ 소라 서비스에서 거리를 걷는 여성을 입력했을 때 나오는 영상의 한 장면.

오픈AI에 따르면 소라는 여러 캐릭터, 특정 유형의 동작 등이 담긴 복잡한 장면을 생성할 수 있다. 오픈AI는 “언어에 관해 깊은 이해를 갖고 있어 프롬프트를 정확히 해석하고 생생한 감정을 표현하는 매력적인 캐릭터를 생성할 수 있다”고 했다.

상황에 따라 적절한 맥락 정보를 알아서 채우는 점도 특징이다. 예컨대 ‘골드러시 시대 당시 미국 캘리포니아의 역사기록 영상’을 주문하면 사람들이 자동차가 아닌 말을 타고 있는 모습을 알아서 만들어내는 식이다. 

한계는 있다. 방향을 잘못 구현하거나 원인과 결과를 언급하면 시간 순서를 이해하지 못하는 경향 등이 발견됐다.

주목 받는 이유는? 

텍스트를 영상으로 전환하는 인공지능은 기존에도 존재했지만 소라가 주목 받는 이유는 높은 수준의 영상 시연을 통해 상용화 가능성을 보여줬다는 데 있다. 챗GPT를 만든 오픈AI에 대한 기대감도 반영됐다. 

앞서 지난해 9월 페이스북과 인스타그램 등을 운영하는 메타는 동영상 생성 AI 모델인 ‘메이크 어 비디오(Make-A-Video)’ 개발 성과를 공개했다. 구글은 지난해 12월 동영상 생성AI 모델 ‘비디오 포엣(Video Poet)’을 발표했다. 다만 이들 서비스는 대중에게 공개되지는 않았고 영상에 다소 어색한 면이 있었다. 반면 오픈AI는 우선 제한된 창작자들에게 사용을 허가하겠다고 밝혔고 실제 영화로 오인할 정도로 자연스럽다.

오픈AI는 소라의 기술적 성과에 관해 “범용인공지능(AGI) 달성을 위한 중요한 이정표가 될 것”이라고 했다. 범용인공지능은 스스로 추론하고 성장하는 자율적 인공지능을 뜻한다. ‘궁국의 AI’를 만들기 위한 토대가 마련됐다는 것이다.

예상되는 우려는? 

생성형 AI 기술이 발전하면서 사회적으로 우려도 커지고 있다. 특히 동영상 생성이 가능해지면 여러 측면에서 악용될 수 있다.

우선 정치적 측면의 허위정보 문제가 불거질 수 있다. 최근 조 바이든 미 대통령이 “트랜스젠더는 여성이 될 수 없다”는 혐오발언을 하는 딥페이크 영상이 유포돼 논란이 됐다. 도널드 트럼프 전 미국 대통령이 격하게 저항하다가 체포되는 사진은 풍자 목적으로 만들었지만 사실로 믿는 사람들이 적지 않았다. 이 기술을 활용하면 더욱 더 그렇 듯한 허위정보를 만들어낼 수 있다. 

성폭력 범죄 등 선정적으로 쓰일 우려도 있다. 지금도 연예인의 사진이나 영상 정보를 학습해 포르노 영상에 합성한 딥페이크 영상이 세계적인 문제가 된 상황이다. 범죄에 악용될 수도 있다. 국내에선 손석희 전 JTBC 사장 딥페이크 영상 사칭 광고 사례도 있다. 

▲ 사진=Gettyimagesbank
▲ 사진=Gettyimagesbank

오픈AI도 우려를 인지하고 있기에 서비스 발표와 동시에 ‘안전성’을 강조했다. 오픈AI는 영상 전문가들이 합류한 레드팀을 만들어 문제와 취약점을 찾아내는 방식으로 안전성 테스트를 하고 있다. 향후 제한된 이용자에게만 서비스하는 것도 오남용 소지를 줄이려는 조치로 보인다.

인공지능 기술이 빠르게 발전하면서 일자리 위협도 커지고 있다. 생성형 인공지능이 보편화되면서 카피라이터, 디자이너 등의 일자리가 위협받고 있는데 영상 관련 직군도 영향을 받을 수 있다.

지난해 3월 챗GPT 개발사인 오픈AI와 펜실베니아 대학교 연구진이 생성형 인공지능으로 피해를 보는 직업을 조사한 결과 수학자, 세무사, 회계사, 작가, 웹디자이너, 기자, 통번역사 등이 꼽혔다. 경제협력개발기구(OECD)는 지난해 7월 공개한 ‘2023년 고용 전망’ 보고서를 통해 “38개 회원국 전체 고용의 약 27%를 차지하는 숙련된 직종이 인공지능 기반 자동화로 가장 큰 위험에 처해 있다”고 전망했다.

저작권자 © 미디어오늘 무단전재 및 재배포 금지