[테크월드=배유미 기자] AI 컴퓨팅 기술업체 엔비디아(Nvidia)가 슈퍼컴퓨터 DGX 슈퍼 POD(DGX SuperPOD) 2세대 모델을 공개했다.
해당 컴퓨터는 엔비디아 DGX A100 시스템과 멜라녹스(Mellanox) 네트워크 패브릭을 기반으로 3주만에 구축됐다. 몇 주가 소요되는 복잡한 언어 이해 모델 처리시간을 한 시간으로 단축시키며, 세계에서 20번째로 빠른 속도를 자랑한다.
엔비디아는 지난 해 여러 DGX 시스템을 결합한 DGX 슈퍼 POD를 처음 선보였다. 이는 일반적인 슈퍼컴퓨터에 들어가는 비용과 에너지 사용량을 줄이고, 획기적인 성능을 제공한다. 또한, 시스템 간 상호연결성을 높이고 획기적인 성능을 제공하기 위해 멜라녹스 스위치를 활용한다.
또한, 엔비디아는 DGX 슈퍼 POD와 DGX A100을 통해 사용량 기반 지불방식 모델의 AI 네트워크 패브릭을 설계했다. 이를 통해 쉽게 확장이 가능하면서도 운영에 미치는 영향을 최소화할 수 있다.
뿐만 아니라, DGX 슈퍼POD를 확장가능한 20개의 DGX A100 시스템 그룹으로 모듈화 했다. 각각은 멜라녹스 HDR 인피니밴드를 사용하는 2티어 팻트리(Fat-Tree) 스위치 네트워크 토폴로지로 지원되며, 초과가입(Oversubscription) 없이 완전한 바이섹션 대역폭을 제공한다. 이에 세 번째 스위칭 티어를 추가하면 드래곤플라이+(DragonFly+) 또는 팻트리 토폴로지를 통해 수천 대의 시스템으로 확장 가능하다.
약 700페타플롭(PF)의 AI 성능을 제공하는 2세대 DGX 슈퍼POD는 ▲140개의 DGX A100 시스템 ▲1120개의 엔비디아 A100 GPU ▲170개의 멜라녹스 퀀텀 200G 인피니밴드 스위치 ▲15km의 광 케이블 ▲4PB 고성능 스토리지와 같은 특징을 가지고 있다.
한편, 엔비디아는 2세대 DGX 슈퍼POD의 스토리지 인프라를 위해 DDN과 협력했다. DDN은 DGX POD 파트너사 중 하나로 AI 인프라 제공에 필요한 성능과 확장성 향상을 지원한다.