엔비디아 HGX A100 4-GPU, 3세대 인텔 제온 스케일러블 프로세서 탑재… AI·HPC·클라우드 워크로드 가속화

[테크월드뉴스=서유덕 기자] 슈퍼마이크로컴퓨터(이하 슈퍼마이크로)는 엔비디아 암페어 아키텍처 GPU와 AI 액셀러레이터가 탑재된 3세대 인텔 제온 스케일러블 프로세서를 기반 신규 시스템을 18일 발표했다.

이번에 새로 발표된 서버는 로우 레이턴시, 고성능을 요구하는 AI 애플리케이션을 위해 설계됐다. 2U 엔비디아 HGX A100 4-GPU 시스템은 고속 CPU-GPU, GPU-GPU 상호 연결을 통해 최신 AI 훈련 클러스터를 대규모로 배포하는 데 적합하다. 슈퍼마이크로 2U 2-노드 시스템은 전원 공급 장치와 냉각 팬을 공유함으로써 탄소 배출량뿐만 아니라 에너지 사용량과 비용을 절감한다. 또한 각 워크로드에 적합한 다양한 개별 GPU 액셀러레이터를 지원한다. 이 두 시스템은 최신 인텔 소프트웨어 가드 익스텐션에 의해 활성화되는 고급 하드웨어 보안 기능을 포함한다.

찰스 리앙(Charles Liang) 슈퍼마이크로 사장 겸 CEO는 “슈퍼마이크로는 시장에 소개된 다른 설계 방식들에 비해 비용, 공간, 전력 소비 등을 절감하는 고성능 GPU 기반 시스템 포트폴리오를 한 차원 더 확대했다”며 “혁신적인 설계를 통해 고객에게 고밀도 2U 폼팩터에서 AI·HPC 워크로드를 위한 엔비디아 HGX A100(코드 네임 레드스톤) 4-GPU 액셀러레이터를 제공할 수 있게 됐다”고 설명했다. 이어 “슈퍼마이크로 2U 2-노드 시스템은 전력·냉각 구성요소를 공유하도록 설계돼 운영 비용을 절감하고 환경 영향을 줄인다”고 말했다.

슈퍼마이크로 2U 엔비디아 HGX A100 4-GPU 시스템
슈퍼마이크로 2U 엔비디아 HGX A100 4-GPU 시스템

2U 엔비디아 HGX A100 서버는 인텔 딥러닝 부스트 기능이 탑재된 3세대 인텔 제온 스케일러블 프로세서를 기반으로 하며 분석, 훈련, 추론 워크로드에 최적화돼 있다. 이 시스템은 4개의 A100 GPU가 엔비디아 NV링크와 완전히 상호 연결돼 최대 2.5 페타플롭의 AI 성능을 제공할 수 있으며, 최대 320GB의 GPU 메모리를 제공, 엔터프라이즈 데이터 사이언스와 AI 분야 혁신을 가속화한다. 이 시스템은 BERT 라지 인퍼런스(large inference) 같은 복잡한 대화형 AI 모델을 위한 이전 세대 GPU보다 최대 4배 빠르며, BERT 라지 AI 훈련에서 최대 3배 향상된 성능을 제공한다.

또한, 해당 시스템은 고효율 열·냉각 설계로 노드 밀도와 전력 효율성이 우선시되는 고성능 클러스터에 이상적이며, 액체 냉각도 가능해 훨씬 더 많은 운영비용을 절감할 수 있다. 뿐만 아니라, 인텔 옵테인 영구 메모리도 지원해 GPU에서 처리하기 전, 훨씬 더 큰 모델을 CPU와 가까운 메모리에 보관할 수 있다. 멀티 시스템 인터랙션이 필요한 애플리케이션의 경우, 시스템에 4개의 엔비디아 커넥트X-6 200Gb/s 인피니밴드 카드를 탑재해 GPU와 DPU 비율이 1:1인 GPUDirect RDMA를 지원할 수도 있다.

슈퍼마이크로 2U 2-노드 시스템
슈퍼마이크로 2U 2-노드 시스템

새로운 슈퍼마이크로 2U 2-노드 시스템은 각 노드가 최대 3개의 더블 슬롯 GPU를 지원하도록 설계된 에너지 효율적인 리소스 절약형 아키텍처다. 각 노드는 최대 40개의 코어와 AI·HPC 액셀러레이터가 탑재된 싱글 3세대 인텔 제온 스케일러블 프로세서가 특징이며, 이 CPU와 GPU의 균형은 다양한 AI, 렌더링, VDI 애플리케이션에 이점을 줄 수 있다.

이 밖에 빠르고 유연한 네트워킹 기능을 위해 슈퍼마이크로의 고급 I/O 모듈(AIOM) 확장 슬롯이 탑재돼 있어 워크로드와 학습 모델을 보호하면서 까다로운 AI/ML 애플리케이션, 딥러닝 훈련·추론을 위한 대규모 데이터도 처리할 수 있다. 멀티 인스턴스를 사용하는 하이엔드 클라우드 게임과 기타 많은 컴퓨팅 집약적인 VDI 애플리케이션에도 이상적이다. 해당 시스템을 사용해 버추얼 콘텐츠 딜리버리 네트워크(vCDNs) 또한 스트리밍 서비스에 대한 증가하는 수요를 충족시킬 수 있다. 리던던시형 전원 공급 장치가 탑재돼 장애 발생 시 어떤 노드든지 인접 노드의 전원 공급 장치를 사용할 수 있다.

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지
이 기사와 관련된 기사