와트당 우수한 성능 제공
높은 컴퓨팅 밀도와 HBM 용량 갖춰

[테크월드뉴스=이재민 기자] 오늘날 고성능 컴퓨팅(High Performance Computing, HPC)이 엑사플롭스(EF)급 한계를 넘어 발전하기 위해서는 클럭 주기 낭비, 작업량 감소, 전력 소모 증가 등의 문제를 해결해야 한다. 엑사는 100경을 의미하는 단위로, 1EF급 슈퍼컴퓨터는 1초에 연산을 100경 번 처리할 수 있다는 뜻이다.

자일링스(Xilinx)가 현재 HPC의 문제점을 해결하는 ‘알베오(Alveo) U55C 가속기 카드’를 11월 16일 온라인 간담회에서 공개했다. 알베오 U55C는 지금까지 출시된 자일링스 알베오 가속기 포트폴리오 중 가장 높은 컴퓨팅 밀도와 HBM 용량을 갖췄다. 또한 HPC 및 빅데이터 작업 부하를 위해 와트(W)당 우수한 성능을 제공하며, 자사 HPC 클러스터링 솔루션을 통해 손쉽게 확장이 가능하다. 이외에도 ▲데이터 파이프라인 병렬화 ▲탁월한 메모리 관리 ▲파이프라인 전반에 걸쳐 최적화된 데이터 이동 등의 특징을 가진다. 고객들은 새로운 자일링스 RoCE v2 기반 클러스터링 솔루션을 이용해 기존 데이터센터 인프라 및 네트워크에서 강력한 FPGA 기반 HPC 클러스터링을 구현할 수 있다.

알베오 U55C는 낮은 150W의 최대 전력으로 단일 슬롯 FHHL(Full Height, Half Length) 폼팩터로 구성됐다. 이전 제품인 ‘듀얼 슬롯 알베오 U280 카드’ 대비 2배에 이르는 16GB HBM2와 컴퓨팅 밀도를 제공한다. 이로써 빅데이터 분석, AI 애플리케이션과 같이 확장이 필요한 빅 컴퓨팅, 고밀도 스트리밍 데이터, 높은 IO가 수반되는 수학 문제 등을 해결할 수 있다.

▲ 자일링스 알베오(Alveo) U55C 가속기 카드
▲ 자일링스 알베오(Alveo) U55C 가속기 카드

RoCE v2, 데이터센터 브릿징, 200Gbps 대역폭 등을 활용하는 API 기반 클러스터링 솔루션은 공급업체에 종속되지 않고, 성능 및 처리지연 측면에서 인피니밴드(InfiniBand)에 준하는 알베오 네트워크를 구현할 수 있다. HPC 개발자들은 통합 MPI를 통해 자일링스 바이티스(Vitis) 통합 소프트웨어 플랫폼에서 알베오 데이터 파이프라인을 스케일 아웃(Scale-Out)할 수 있다. 이제 기존 개방형 표준과 프레임워크를 활용해 서버 플랫폼, 네트워크 인프라와 공유 작업 부하, 메모리 등과 상관없이 수백 개의 알베오 카드를 확장할 수 있다.

또한 바이티스 플랫폼을 활용해 애플리케이션 및 클러스터의 하이-레벨 프로그래밍 기능으로 알베오와 적응형 컴퓨팅의 이점을 누릴 수 있다. 파이토치(Pytorch), 텐서플로우(Tensorflow)와 같은 주요 AI 프레임워크는 물론 C, C++, 파이썬(Python)과 같은 하이-레벨 프로그래밍 언어를 지원해 개발자들은 기존 데이터센터 주요 HPC 작업 부하를 쉽게 가속화할 수 있다.

HPC에 알베오 U55C 카드를 적용한 사례는 호주 연방과학산업연구기구(CSIRO), 앤시스, 타이거그래프(TigerGraph) 등이 있다. 세계 최대 규모의 전파 천문학 안테나 어레이를 보유한 CSIRO는 SKA(Square Kilometer Array) 전파 망원경의 신호 처리를 위해 알베오 U55C를 활용하고 있다. 알베오 가속기 기반 클러스터를 통해 13만 1000개의 안테나에서 데이터를 실시간으로 집계하고, 필터링, 준비 및 프로세싱을 위한 방대한 컴퓨팅 작업을 처리하고 있다. P4 지원 100Gbps 스위치와 완벽히 네트워크로 연결된 420개의 알베오 U55C는 신호처리 클러스터 전반에 걸쳐 460GB의 HBM2 대역폭을 제공한다.

대다수의 자동차 기업에서 사용하고 있는 앤시스의 LS-DYNA 충돌 시뮬레이션 소프트웨어는 알베오 U55C를 통해 하이퍼 병렬 데이터 파이프라인이 확장된다. 이에 따라 x86 CPU에 비해 성능을 5배 이상 가속화할 수 있다.

그래프 분석 플랫폼을 공급하는 타이거그래프는 알고리즘을 클러스터링하고 속도를 높이기 위해 알베오 U55C 카드를 사용하고 있다. 알베오 U55C는 추천 엔진에 대한 쿼리(Query) 시간과 예측을 분 단위에서 밀리초 단위로 줄이고, CPU 기반 클러스터에 비해 그래프 쿼리 속도를 최대 45배까지 가속화할 수 있다. 품질 스코어도 최대 35%까지 증가시켜 신뢰도를 높이고, 오탐 빈도(False Positives Rate)를 한 자릿수까지 크게 낮출 수 있다.

살릴 라제(Salil Raje) 자일링스 데이터센터 그룹 수석 부사장 겸 총괄 매니저는 “알베오 U55C 카드는 HPC 작업 부하를 위해 이전보다 훨씬 더 간편하고 효율적이며, 강력한 알베오 컴퓨팅 성능을 확장했다”며 “고객의 기존 인프라와 네트워크를 사용해 알베오 HPC 클러스터를 생성할 수 있는 표준 기반 방법론을 도입해 주요 이점들을 데이터센터의 대규모 확장에 활용할 수 있다. 이런 혁신을 통해 알베오 U55C 카드가 폭넓게 채택될 수 있을 것”이라고 밝혔다.

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지
이 기사와 관련된 기사