오픈AI·구글, LLM 폐쇄적 전략·기술 정보 비공개
메타·알리바바, 오픈소스로 이용자 유치·생태계 활성화

[테크월드뉴스=양승갑 기자] 오픈AI는 챗GPT에 사용되는 GPT 모델을 고도화하면서 관련 서비스를 혁신하고 있다. 현재 대규모언어모델(LLM) 구축에는 천문학적 자금과 R&D가 필요한 만큼 일정 이용자 수를 확보한 오픈AI, 구글 등은 관련 정보를 제한하고 있다. 반면 선두주자에 비해 입지가 약한 메타와 알리바바는 LLM의 오픈소스화를 추진하면서 영향력 확대에 돌입한다는 계획이다.

구글의 대규모언어모델 '팜2'는 정보가 제한적으로 공개됐다 [사진=구글 리서치 유튜브 갈무리]
구글의 대규모언어모델 '팜2'는 정보가 제한적으로 공개됐다 [사진=구글 리서치 유튜브 갈무리]

 

힘들여 개발한 LLM, 개방하기 쉽지 않아

생성형 인공지능(AI) 시장이 나날이 커지고 있다. 블룸버그 인텔리전스는 구글 바드와 오픈AI 프로그램의 유입으로 생성형 AI 시장이 연평균 42%의 고성장을 기록할 것으로 내다봤다. 또한 2032년 전 세계 시장 규모를 1조 3000억 달러(1738조 원)로 예측했다.

특히 주목할 만한 것은 LLM과 연관된 오픈소스다. LLM은 텍스트, 이미지, 음악 등 다양한 유형의 콘텐츠를 생성하기 위한 언어모델로서 AI 기업의 경쟁력과 직결된다. 서비스 배포가 가능한 일정 이상의 성능에 도달하기까지 언어모델을 학습시키고 클라우드, 그래픽처리장치(GPU) 같은 인프라 투자 및 운영에 사용되는 비용도 천문학적이다. 이에 기업에서는 LLM과 관련된 정보를 무료 공개하는 오픈소스 형태가 아닌 제한적으로 개방하고 있다.

구글과 오픈AI는 생성형 AI 시장에서의 영향력이 커짐에 따라 오픈소스 폐쇄적 전략을 수립했다. 구글은 '팜2' 관련 기술의 핵심 정보를 비공개로 하고 있다. 오픈AI도 챗GPT에 사용되는 GPT-4 기술적 내용 대부분을 공개하지 않으며 이전과는 상반된 모습을 보였다. 특히 오픈AI는 비영리를 추구한다는 초창기 설립 취지와 부합하지 않는다는 비판을 받기도 했다.

그렇지만 이러한 행동을 비난하기에는 무리가 따른다. 기업 목적에 맞는 이윤을 추구하기 위한 본원적 경쟁전략인 이유에서다. 차세대 먹거리로 주목받고 있는 생성형 AI 시장은 현재 절대적인 강자가 없다. 오픈AI의 챗GPT가 두각을 드러내고 있지만 메타, 아마존, 알리바바 등 빅테크가 추격하고 있으며 기업 간 연합도 확대되는 추세로 경쟁이 치열해지고 있다.

메타는 대규모언어모델 '라마2'를 오픈소스 형태로 제공하고 있다[사진=메타]
메타는 대규모언어모델 '라마2'를 오픈소스 형태로 제공하고 있다[사진=메타]

 

선두주자 넘을 ‘오픈소스’ 전략 통할까

현재 오픈AI는 마이크로소프트와 협력하고 있으며 구글은 엔비디아와 오픈AI의 대항마라고 평가되는 앤트로픽과 공조하고 있다. 오픈AI 등의 LLM을 사용하는 기업의 경우 시간이 지날수록 기술 종속성을 벗어나기도 쉽지 않다. 뒤늦게 생성형 AI 시장에 참가하게 된 메타와 알리바바는 영향력 확대가 최우선 과제다.

이에 메타와 알리바바는 LLM 개방적 정책을 펼치면서 무료로 이용할 수 있도록 했다. 이용료, 운영비 측면에서 단기간 손해가 불가피하지만 누구나 접근할 수 있는 AI 생태계 구성을 통해 이용자 유치에 집중하고 후발주자로서 AI 판세를 뒤집겠다는 전략이다.

또한 성능 테스트와 문제 개선 과정에서의 오픈소스 커뮤니티의 장점도 강조하고 있다. 메타 관계자는 “개방형 접근 방식이 보다 안전하다”며 “AI 모델을 오픈소스 형태로 제공할 경우 여러 개발자와 연구원들이 하나의 커뮤니티를 형성해 성능을 테스트할 수 있으며 문제점을 빠르게 찾아 해결할 수 있다”고 밝혔다.

알리바바 클라우드 징런 저우 인텔리전스 최고기술책임자(CTO)는 “클라우드는 오픈소스 이니셔티브에 대한 확고하고 장기적인 지지자로서 개방적 접근 방식을 통해 집단지성이 발휘돼 오픈소스 커뮤니티의 활성화에 기여하기를 희망한다”고 말했다.

메타는 LLM ‘라마2’를 오픈소스 형태로 지난 7월 공개했다. 연구와 상업적 용도로 무료 활용할 수 있다. 다만 경쟁사인 구글은 사용할 수 없다. 알리바바의 경우 70억 개 파라미터를 갖춘 LLM을 오픈소스로 공개하면서 전 세계 학계와 연구기관들이 무료로 접근할 수 있도록 개발할 예정이다. 다만 메타와 알리바바도 월간활성이용자(MAU) 수가 각각 7억, 1억 명 이상일 경우 별도의 라이센스 계약이 필요하다.

일각에서는 오픈소스 LLM이 범죄에 이용될 것을 우려하는 의견도 있다. 오픈AI 머신러닝 연구원 얀 라이크 팀 리더는 SNS를 통해 “인류에게 중요한 시험은 LLM을 오픈소스화하지 않는 것을 집단으로 결정하는 점에 있다”며 “LLM은 모든 종류의 범죄에 이용될 것이고 사본을 잡기도 어려우며 책임 소재를 놓고 다투게 될 것”이라고 전한 바 있다.

업계 관계자는 “지금은 LLM이 AI를 대체하는 용어가 될 만큼 중요성을 갖고 있으면서 광범위한 산업에 적용될 수 있는 잠재력이 있다”며 “LLM의 성능과 전략이 기업의 경쟁력을 가르는 크리티컬한 요소가 될 것”이라고 말했다.

한편 국내에서는 AI 전문기업 업스테이지가 한글 데이터를 위한 ‘1T 클럽’을 발족하면서 LLM 독립을 선언하기도 했다. 업스테이지는 1T 클럽을 통해 국내 AI 능력을 향상시키고 글로벌 시장에서의 경쟁도 시도한다. 특히 크롤링을 통한 AI 학습으로 인해 저작권 이슈 등 부작용이 발생하는 문제 해결 및 데이터 제공자와 모델 제작자 모두가 혜택을 볼 수 있도록 운영될 계획이다.

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지
이 기사와 관련된 기사
소문난 잔치에 먹을 것 없는 ‘생성형 AI’, 아직 멀었나
이제 생성형 AI 도입은 선택이 아닌 필수가 됐습니다. 다만 아직 기업에게 생성형 AI를 활용한 비즈니스 모델 수립은 고민인데요. 일각에서는 소규모로 시작해 전체로 확대해가는 비즈니스 모델 수립의 필요성을 강조하기도 합니다.