[테크월드뉴스=양승갑 기자] 업스테이지는 세계 최고 권위의 NLP 학회인 ‘NAACL 2024’에서 솔라 개발 논문을 발표한다고 29일 밝혔다.

[사진=업스테이지]
[사진=업스테이지]

NAACL은 ACL, EMNLP와 함께 세계 3대 NLP 학회로 꼽힌다. 매년 구글, 메타, 아마존 등 글로벌 빅테크 기업과 수천여 명의 NLP 연구자들이 참여해 최신 연구성과를 공유한다. 올해 학회는 6월 16일부터 21일까지 멕시코시티에서 열린다.

이번 NAACL 2024에 채택된 업스테이지 논문은 김다현 연구원, 박찬준 수석 연구원 등의 주도로 김성훈 대표, 이활석 최고기술책임자(CTO) 등 주요 경영진까지 모두 참여한 업스테이지 기술력의 집약체다.

해당 논문은 ‘깊이 확장 스케일링(DUS: Depth-Up Scaling)’이라는 기법으로 대형언어모델(LLM)의 깊이 차원을 확장해 모델 규모를 늘리는 새로운 방법론을 제시했다. LLM은 텍스트 입력에서 처리, 출력까지 다양한 층위의 신경망 레이어로 구성되는데 이런 레이어를 조합해 모델의 성능을 끌어올리는 방식이다.

구체적으로 업스테이지는 ‘라마(Llama)2’ 아키텍처인 ‘미스트랄(Mistral) 7B’를 기반으로 DUS 기법을 적용해 모델의 깊이 차원을 확장, 107억 매개변수로 구성된 ‘솔라 10.7B’ 모델을 개발했다.

업스테이지 솔라는 작년 12월 알리바바 ‘큐원(Qwen)’의 6분의 1도 안되는 크기로 미스트랄AI의 ‘믹스트랄(Mixtral 8x7B)’ 등 빅테크의 대형 모델을 제치고 머신러닝 플랫폼 허깅페이스의 ‘오픈 LLM 리더보드’에서 세계 1위를 차지한 바 있다.

특히 업스테이지는 솔라의 핵심인 사전 훈련된 가중치를 기반으로 추가 학습해 모델 사이즈는 작지만 강력한 모델을 만드는 DUS 방법론을 공식 인정받았음을 의미한다고 설명했다. 지금까지 업스테이지는 국내외 AI 관련 논문 110여 편을 발표하고 구글 스콜라 랭킹 기준 톱 7 NLP 분야 컨퍼런스에서 모두 논문 채택을 달성하기도 했다.

업스테이지 김성훈 대표는 “세계 최고 수준의 언어모델 솔라를 개발한 업스테이지의 기술력을 글로벌 탑티어 학회에서 인정받게 되어 기쁘다”며 “앞으로 업스테이지는 세계 최고 AI 기술력을 토대로 국내는 물론 해외 시장을 주도할 수 있는 강력한 LLM 개발에 힘쓸 것”이라고 밝혔다.

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지