[테크월드=이건한 기자] 엔비디아가 GTC 2020에서 GPU 가속 애플리케이션 프레임워크 '엔비디아 자비스(NVIDIA Jarvis)를 발표했다. 자비스는 기업이 영상과 음성 데이터를 활용해 자사 제품과 고객, 그리고 산업에 최적화된 최첨단 대화형 인공지능(AI) 서비스를 구축하도록 돕는다. 

젠슨 황(Jensen Huang) 엔비디아 창립자 겸 CEO는 “대화형 AI는 애플리케이션이 뉘앙스와 상황을 이해하고 커뮤니케이션하는 능력을 갖기 때문에 많은 산업에 걸쳐 미래의 중심이 될 것"이라고 밝혔다. 

엔비디아 자비스

자비스 기반으로 구축된 애플리케이션은 AI 컴퓨팅을 위한 새로운 엔비디아 A100 텐서 코어(Tensor Core) GPU 기술과 함께 추론을 위한 엔비디아 텐서RT(TensorRT)의 최신 최적화 기능을 활용할 수 있다. 이를 통해 실시간 상호작용에 필요한 수준인 300밀리초 임계값 보다 더 빠르고 강력한 비전/음성 모델을 사용할 수 있으며, 전체 멀티모달(Multimodal) 애플리케이션을 실행할 수 있다.

또한 자비스는 개발자가 각 기업과 고객 고유의 용어를 이해할 수 있는 엔드-투-엔드 실시간 대화형 AI 애플리케이션을 쉽게 생성 · 실행할 수 있도록 하는 GPU 가속 소프트웨어 스택과 툴을 제공한다.

일반적으로 개인화된 대화형 경험을 제공하기 위해 기업들은 자사 제품과 고객 요구사항에 특정된 데이터에 대해 언어 기반의 애플리케이션을 훈련시켜야 한다. 하지만 서비스를 처음부터 구축하려면 전문적인 AI 관련 지식이 필요할뿐더러, 대량의 데이터와 컴퓨팅 리소스, 업데이트 소프트웨어 등이 필요하다. 

자비스는 대화형 AI를 위한 엔드-투-엔드 딥러닝 파이프라인을 제공해 이런 과제를 해결한다. 여기에 자연어 이해를 위해 엔비디아의 메가트론 버트(Megatron BERT)와 같은 최첨단 딥러닝 모델을 포함하고 있다.

기업들은 엔비디아 네모(NVIDIA NeMo)를 사용해 데이터에서 이러한 모델을 미세 조정하고 텐서RT를 통해 추론을 최적화하며, 엔비디아의 GPU 최적화 소프트웨어 카탈로그인 NGC에서 이용할 수 있는 헬름(Helm) 차트를 활용해 클라우드 및 엣지 환경에 배치할 수 있다.

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지
이 기사와 관련된 기사