엔비디아, MLPerf AI 벤치에서 8개 부문 최고 성능 달성
상태바
엔비디아, MLPerf AI 벤치에서 8개 부문 최고 성능 달성
  • 이건한 기자
  • 승인 2019.07.12 11:31
  • 댓글 0
이 기사를 공유합니다

기존에는 하루가 걸리던 모델 훈련 시간, 2분 정도로 단축

[테크월드=이건한 기자] 엔비디아가 자사의 인공지능(AI) 플랫폼이 MLPerF AI 벤치마크 테스트 8개 부문에서 최고의 성능을 기록했다고 밝혔다.

엔비디아 MLPerf AI 기록 (자료=엔비디아 제공)
엔비디아 MLPerf AI 기록 (자료=엔비디아 제공)

위 표에서 밝힌 액셀러레이터당 성능 비교는 단일 엔비디아 DGX-2H(16 V100 GPUs) 상의 MLPerf 0.6 보고 기록과 MiniGo를 제외하고, 기타 동일한 규모의 제출 결과를 기반한 것이다. MiniGo의 경우는 엔비디아 DGX-1 (8 V100 GPUs) 제출 결과가 사용되었다.

▲MLPerf ID 최대 규모: 마스크 R-CNN: 0.6-23 ▲GNMT: 0.6-26, MiniGo: 0.6-11 ▲액셀러레이터 당 MLPerf ID: 마스크 R-CNN, SSD, GNMT ▲트랜스포머: 전부 0.6-20 사용, MiniGo: 0.6-10

엔비디아는 이 같은 결과를 간단히 말해 "기존에는 하루가 걸리던 모델 훈련 시간이 2분도 안 되는 시간으로 대폭 단축된 것"이라고 설명하며, "이번 MLPerf 테스트 결과는 엔비디아의 V100 텐서 코어 GPU를 슈퍼컴퓨터급 인프라에서 통합함으로써 얻을 수 있는 혜택을 증명한 것"이라고 덧붙였다.

2017년만 해도 V100 GPU가 탑재된 엔비디아 DGX-1 시스템이 RestNET-50 이미지 인식 모델 트레이닝에 걸린 시간은 8시간이었다. 하지만 현재는 동일한 GPU를 사용하는 엔비디아 DGX 슈퍼POD 모델이 멜라녹스 인피니밴드 분산 AI 트레이닝에 최적화된 최신 AI 소프트웨어와 결합해 동일한 작업을 약 80초 만에 완료하는 수준으로 진보했다.

엔비디아의 AI 플랫폼은 특히 중량 객체 탐지, 강화학습 등과 같은 AI 문제 해결에서 두각을 나타냈다. 마스크 R-CNN 딥 신경망을 사용한 중량 객체 탐지는 카메라, 센서, 라이다, 초음파 등과 같은 데이터 소스와 결합해 특정 객체를 정확히 식별하고 위치를 찾아낼 때 유용하게 사용될 수 있다.

이런 종류의 AI 워크로드는 자율주행차에 보행자나 다른 객체의 정확한 위치를 알려주기 때문에 자율주행차 트레이닝에 도움이 된다. 의사들이 의료용 스캔에서 종양을 찾고, 파악하는 데 도움이 되는 부분 또한 주요한 활용사례 중 하나라다.

엔비디아는 19분이 채 안 된 엔비디아의 중량 객체 탐지 제출 결과는 2위와 비교해 거의 2배 더 우수한 성능을 보여준 것이라고 밝혔다. 

한편 엔비디아는 엔비디아 NGC 컨테이너 레지스트리에서 무료로 다운로드할 수 있는 통합 소프트웨어 스택과 함께 CUDA-X AI에 대한 새로운 최적화와 성능 개선을 매달 발표하고 있다.

여기에는 컨테이너화된 프레임워크, 사전 트레이닝 된 모델과 스크립트도 포함된다. 이러한 CUDA-X AI 소프트웨어 스택의 개선을 통해, MLPerf 0.6 제출 결과에서 엔비디아 DGX-2H 서버의 처리량은 7개월 전보다 80%까지 향상된 것으로 나타났다.