스포츠, 미디어, 엔터테인먼트, 교육, 보안 등 산업계 전반 즉시 적용

[테크월드뉴스=양승갑 기자] 영상이해 초거대 AI 개발 기업 트웰브랩스는 초거대 AI 영상언어 생성 모델 ‘Pegasus-1’(페가수스)를 정식 공개했다고 9일 밝혔다.

[사진=트웰브랩스]
[사진=트웰브랩스]

트웰브랩스는 멀티모달 신경망 기술을 바탕으로 글로벌 영상 AI 시장에서 활약하고 있다. 글로벌 시장조사 기업 CB 인사이트 선정 ‘세계 100대 AI 기업’ 및 ‘세계 50대 생성 AI 스타트업’에 선정됐으며 엔비디아, 인텔, 삼성넥스트, 한국투자파트너스 등으로부터 1000만 달러(약 140억 원) 규모의 전략적 투자를 유치한 바 있다.

이번에 공개한 페가수스 모델은 트웰브랩스가 자체 개발한 800억 파라미터 규모의 초거대 영상언어 생성 모델이다. 긴 영상을 마치 사람처럼 정확하고 정교하게 텍스트로 요약하거나 챗GPT를 사용하듯 영상에 관한 자유로운 질의응답을 가능케 하는 등 이전에 존재하지 않았던 영상 기반 텍스트 생성 기능들을 최초로 선보였다. 트웰브랩스는 자체적으로 구축한 3억 개 이상, 영상-텍스트 페어로 구성된 데이터셋 중 약 10% 규모인 3500만 개 분량을 이번 모델 개발을 위해 활용했다.

트웰브랩스에 따르면 페가수스 모델은 현재까지 공개된 최고 성능의 영상언어모델 대비 최대 61%의 성능 우위를 보인다. 개발자용 API 형태로 상용화돼 즉시 도입 가능하다. 나아가 오픈AI가 발표한 GPT4-V에서 볼 수 있었던 Text-To-Text 혹은 Image-To-Text를 넘어선 긴 영상에 대한 요약, 영상 내 주제별 챕터 및 하이라이트 기능, 질의응답 기능 등 Video-To-Text도 가능하다.

이번 페가수스 모델 공개로 트웰브랩스는 영상 콘텐츠의 이해와 활용에 있어 새로운 장이 열릴 것으로 기대하고 있다. 페가수스 모델은 현재 트웰브랩스 홈페이지 내 대기자 명단 등록을 통해 순차적으로 사용 가능하며 내년 1분기부터는 대중에게 공개될 예정이다.

트웰브랩스는 스포츠, 미디어, 엔터테인먼트, 교육, 물리보안 등 다양한 산업 분야 별 글로벌 기업들과 긴밀한 협업 관계를 구축하고 있다. 국내에서도 세종특별자치시, 과학기술정보통신부, 한국인터넷진흥원과 함께 차세대 지능형 영상 관제 실증 사업을 진행하는 등 핵심 활용 사례들을 중심으로 빠르게 사업 영역을 넓혀나가고 있다.

트웰브랩스 이재성 대표는 “트웰브랩스는 2021년부터 인간과 유사한 수준의 영상이해 기술 구현을 위해 꾸준히 노력해왔다”며 “페가수스 모델이 물리보안 영상들에 대한 자동 리포트 생성, 스포츠 영상 하이라이트 생성 등 다양한 산업계에서 오랫동안 해결하지 못했던 문제들의 솔루션이 되길 바란다”고 밝혔다.

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지