[테크월드뉴스=서유덕 기자] 엔비디아는 마이크로소프트 애저(Azure)가 ND A100 v4 가상머신(VM) 시리즈의 공식 출시를 알렸다고 3일 밝혔다.

엔비디아 A100
엔비디아 A100

ND A100 v4 VM 시리즈는 슈퍼컴퓨터급 AI와 고성능컴퓨팅(HPC) 워크로드를 위한 마이크로소프트의 VM으로, 엔비디아 A100 텐서 코어(Tensor Core) GPU와 엔비디아 HDR 인피니밴드(InfiniBand)로 구동된다.

엔비디아는 애저와의 협업을 통해 스케일 업(scale-up)/아웃(scale-out) 형태의 AI 플랫폼을 새로 설계했다. 이 플랫폼은 엔비디아 암페어(Ampere) 아키텍처 기반 GPU와 네트워킹 기술, 애저의 고성능 인터커넥트와 VM 패브릭을 결합해 비교적 쉽게 사용 가능한 AI 슈퍼컴퓨팅을 구현한다.

AI와 HPC 관련 주요 과제의 해결에는 규모(scale)가 핵심이다. 자연어 처리, 추천 시스템, 헬스케어 연구, 신약 개발, 에너지와 같은 분야는 가속 컴퓨팅의 도움에 지속 발전하고 있다. 이런 발전은 대규모 애플리케이션에서 비롯되며, 이를 뒷받침하기 위해 애플리케이션이 실행되는 아키텍처가 유연하고 접근성이 높아야 하고 스케일 업/아웃 형태를 함께 취해야 한다.

ND A100 v4 VM은 단일 VM에서 8개의 엔비디아 A100 GPU와 GPU당 200GB/s의 데이터 대역폭을 지원하는 엔비디아 HDR 인피니밴드를 결합한다. 이를 통해 VM당 1.6Tb/s에 이르는 인터커넥트 대역폭을 구현한다.

또한 AI와 HPC 워크로드의 경우, 동일한 저지연 인피니밴드 패브릭에서 수천 개의 엔비디아 A100 GPU로 확장해 다중 노드 분산 컴퓨팅을 위한 컴퓨팅과 네트워킹 기능 모두를 지원할 수 있다.

한편, 엔비디아는 개발 절차를 간소화하고 시간을 단축하도록 지원하는 GPU 최적화 애플리케이션 프레임워크와 컨테이너, 사전 훈련된 모델, 라이브러리, SDK, 헬름 차트(Helm chart)를 제공한다. 애저 마켓플레이스(Azure Marketplace) 상에 사전 구축된 AI와 HPC용 엔비디아 GPU 최적화 이미지를 통해, 개발자들은 NGC 카탈로그에서 GPU 가속 소프트웨어를 사용할 수 있다. 아울러, ND A100 v4 VM은 대화형 AI 개발, 분산 훈련, 배치(batch) 추론, ML Ops를 통한 자동화를 위해 애저 머신러닝(Azure Machine Learning) 서비스에서도 지원된다.

이밖에, 엔비디아 트라이톤(Triton) 인퍼런스 서버를 사용하면 생산단계에서 ND A100 v4 VM을 통해 머신러닝 파이프라인을 구축하는 작업을 더욱 간소화할 수 있다. 엔비디아 트라이톤은 오픈소스 소프트웨어로, 애저 머신러닝 서비스와 결합돼 GPU·CPU의 성능과 활용도를 극대화함으로써 운영비를 최소화한다.

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지