[테크월드뉴스=양승갑 기자] 오픈AI가 텍스트로 비디오를 생성할 수 있는 인공지능(AI) 모델 ‘소라(Sora)’를 공개했다.

프롬프트에 '골드러시 시절 캘리포니아의 역사적 영상'이라고 입력한 모습. [자료=오픈AI]
프롬프트에 '골드러시 시절 캘리포니아의 역사적 영상'이라고 입력한 모습. [자료=오픈AI]

15일(현지시간) 오픈AI는 소라에 대해 “여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 디테일이 포함된 복잡한 장면을 생성할 수 있다”며 “사용자가 프롬프트에서 요청한 내용뿐만 아니라 실제 세계에 사물이 어떻게 존재하는지도 이해한다”고 밝혔다.

오픈AI에 따르면 소라는 간단한 텍스트 입력만으로 최대 1분 길이의 비디오를 생성한다. 이미지 생성 AI ‘달리(DALL-E)’와 활용 방법도 비슷하다.

예를 들어 ‘골드러시 시절 캘리포니아의 역사적 영상’이라고 입력하면 소라가 산, 강을 배경으로 펼쳐져 있는 마을과 그 마을에 거주하고 있는 사람들의 모습을 사실적으로 묘사한다. 언어에 대한 깊은 이해를 바탕으로 프롬프트를 정확하게 해석하고 생동감 넘치는 매력적인 캐릭터를 생성할 수 있다는 것이 회사 측 설명이다.

현재까지는 제한된 일부의 창작자들만 접근 가능한 것으로 알려져 있지만 추후 현재 텍스트 기반 챗GPT와 같이 사용자 개방이 이뤄질 경우의 그 잠재력은 매우 클 것으로 예상된다. 예컨대 1분 이내의 동영상이 중심인 광고 동영상 등에 대해서는 즉시적인 대체 효과가 발생할 수도 있기 때문이다. 광고 촬영을 위한 배우와 장소 섭외, 촬영, 편집 등에 대한 비용 부담이 큰 중소형 기업들에게는 소라 서비스가 매우 저렴한 대안이 될 수 있기 때문이다. 

다만 한계점도 존재한다. 복잡한 장면을 정확하게 묘사하는 데 어려움이 있으며 원인과 결과에 따른 특정 사례를 이해하지 못할 수도 있다. 가령 사람이 쿠키를 한 입 베어 물었지만 쿠키에는 물린 자국이 없을 수도 있다.

오픈AI는 “소라는 GPT 모델과 유사한 변환기 아키텍처를 사용해 뛰어난 확장 성능을 제공한다”며 “실제 세계를 이해하고 시뮬레이션할 수 있는 모델의 기반 역할을 할 것이며 AGI 달성을 위한 중요한 이정표가 될 것이라고 믿는다”고 설명했다.

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지