컴포저블, 가속화에 초점 맞춰

[테크월드뉴스=이재민 기자] 자일링스(Xilinx)가 ‘알베오 SN1000 Smart NIC(이하 SN1000)’, ‘스마트 월드’, ‘가속 알고리즘 트레이딩’ 등을 공개하면서 데이터센터 시장 공략을 본격화했다.

3월 3일에 열린 ‘데이터센터 솔루션 온라인 기자간담회’에서 자일링스는 네트워킹 대역폭을 늘리고, AI와 실시간 분석과 같은 작업을 가속화하는 등 최신 데이터센터의 수요에 맞는 제품과 솔루션을 소개했다.

데이터센터 분야는 인공지능(AI)의 발전, 복잡한 워크로드, 비정형 데이터 등으로 인해 빠르게 진화하고 있다. 이에 대처하기 위해 자일링스는 ‘컴포저블(Composable, 구성을 변경할 수 있는) 데이터센터’를 구축했다. 컴포저블 데이터센터는 단순히 컴퓨팅, 네트워크, 스토리지 등을 분리해 사용하고, 이들을 분리해서 애플리케이션의 필요에 맞추는 차원을 넘어 디바이스, 리소스 등을 독립적으로 구성할 수 있다. 자일링스의 컴포저블 데이터센터를 구축하는 3가지는 다음과 같다.

컴포저블 하드웨어 기반의 알베오 SN1000
몇 년 전 나온 표준 NIC(닉 : 컴퓨터를 네트워크에 연결해 통신하기 위해 사용하는 하드웨어 장치)은 10Gbps까지 속도를 내면서 CPU에 병목현상이 발생했다. 속도가 25~40Gbps까지 올라가면서 병목현상은 더 심해졌고, 이때 오프로드 NIC이 출시됐다. 하지만 오프로드 NIC은 ASIC(특정 용도에 맞게 맞춤 제작된 집적 회로) 기반이었기 때문에 프로그래밍이 불가능했고, 오프로딩이 제한됐다. 이런 문제를 해결하기 위해 스마트 NIC(Smart NIC)이 등장했다. 스마트 NIC은 ASIC, ARM, FPGA(프로그래밍이 가능한 비메모리 반도체)를 기반으로 한다. 이로써 프로그래밍과 광범위한 오프로딩이 가능하다.

스마트 NIC인 알베오 SN1000은 업계 최초로 컴포저블 하드웨어 기반이며 울트라스케일+ 자일링스의 FPGA에 대한 적응성을 가지고 있다. 또한 멀티플 ARM을 갖고 있어 제어 플레인과 데이터 플레인이 따로 분리됐다. 바이티스(Vitis) 네트워킹을 통해 높은 수준의 프로그래밍 언어(P4, C, C++)를 사용하고, 새로운 프로토콜과 애플리케이션을 처리하는 네트워크 기능을 구현할 수 있다.

SN1000의 가장 큰 특징은 컴포징(구성요소를 변경하는 것)이 가능하다는 것이다. SN1000은 프리 프로그래밍이 돼 네트워크, 스토리지, 보안을 위한 가속화가 이미 이뤄져 있다. 동일한 스마트 NIC 상에 완전히 다른 트래픽 부분인 방화벽, 게이트웨이 등을 추가하면서 동시에 먼저 가지고 있던 스토리지도 유지할 수 있다. SN1000을 통해 애플리케이션별로 특화된 데이터 경로를 만드는 동시에 기존에 있던 오프로드 부분을 더 확장할 수 있는 것이다. 이는 곧 성능 저하없이 SN1000 플로우에 손쉽게 커스터마이제이션할 수 있다는 뜻이다.

정리하면 SN1000의 차별점은 ▲모든 오프로드를 위한 소프트웨어-정의 하드웨어 가속화 ▲회선속도 성능을 제공하는 애플리케이션별로 특화된 데이터 경로 ▲고속, 적응형 하드웨어 가속을 위한 P4, C, C++ 프로그래밍 ▲제어 플레인과 데이터 플레인이 분리된 이기종 아키텍처 등이다.

 

AI 비디오 분석 플랫폼 스마트 월드
자일링스의 스마트 월드는 AI 비디오 분석을 위한 플랫폼이다. 스마트 월드는 대규모 병렬 처리가 가능해 최소한의 하드웨어에서 여러 모델을 원활하게 처리할 수 있다. 100ms 미만의 파이프라인 지연시간을 기록하고, 단일 알베오 가속기 카드 상에서 다중 신경망을 지원할 수 있다. 그 결과 업계에서 가장 낮은 TCO(총소유비용)를 달성했다. 경쟁사인 엔비디아의 T4와 비교했을 때 TCO는 약 30%, 지연시간은 71~77% 감소했다. 이렇게 될 수 있었던 건 하드웨어를 절반으로 줄이면서 동일한 작업을 할 수 있었고, 한마디로 비용은 줄이면서 퍼포먼스를 높인 것이다.

자일링스 알베오 카드로 파이프라인 전체를 옮겼을 때 CPU에서 처리하던 부분들이 알베오로 이동하게 되고, 각 단계별 퍼포먼스가 개선돼 애플리케이션 전체가 가속화된다. 또한 GPU도 알베오로 옮길 수 있어 단순히 AI 추론뿐만 아니라 AI 트레이닝까지도 가능하게 된다.

스마트 월드의 주요 솔루션은 ▲밉솔로지(Mipsology) ▲디파이(DeepAI) ▲오페라(Aupera) 등이 있다. 밉솔로지는 기존 AI 애플리케이션을 쉽게 마이그레이션할 수 있는 툴 세트와 고성능 플러그&플레이 방식의 AI 추론 가속기를 공급한다. 디파이는 GPU 대비 비용당 최대 10배 향상된 성능을 보여주는 FPGA 기반 엣지 AI 트레이닝을 제공한다. 오페라는 지능형 비디오 프로세싱과 알베오 가속기를 결합한 턴키 스마트 시티와 스마트 리테일 솔루션을 제공한다.

 

저지연을 달성한 가속 알고리즘 트레이딩
알고리즘 트레이딩은 전통적으로 진입장벽이 높았다. FPGA 하드웨어 가속화 기술을 사용하기 위해서는 하드웨어 개발자, 고가의 디바이스가 필요했다. 맞춤화하는 과정에서 개발 리드타임도 길었다. 이런 이유로 알고리즘을 개발할 수 있는 제3자에게 넘기거나 소프트웨어를 개발하는 만큼 시장 변화에 빠르게 대응하지 못하는 리스크가 발생했다.

더 짧은 지연시간(저지연) 트레이딩이 요구되는 이유는 지연시간 경쟁에서 실패하면 비용이 많이 소모되고, 거래비용(TCA)이 늘어나게 되기 때문이다. 그래서 일반적으로 고객들은 μs(마이크로초)의 지연시간을 요구한다. 이렇게 되기 위해서는 반드시 하드웨어 가속화가 필요하다. CPU만을 사용하는 것은 한계에 도달했기 때문이다. 그러나 FPGA는 네트워크와 바로 연결돼 15ns(나노초)를 달성할 수 있다.

가속 알고리즘 트레이딩은 라이선스 비용 없이 묘듈화되고, 오픈 소스 기반의 자일링스 바이티스 라이브러리를 무료로 사용할 수 있다. 라이브러리 모음으로 트레이딩 아키텍처를 유연하게 구성할 수 있고, C/C++ 기반의 바이티스 프로그래밍이 가능하다. 또한 사내(in-house) 또는 협력업체 앱과 손쉽게 통합할 수 있다.

가속 알고리즘 트레이딩은 거래소, 시장 데이터 공급업체, 매도부문(Sell Side) 벤더, 자기자본 트레이더 등에 적용될 수 있다. 증권사의 경우 거래를 하기 전에 어떤 이슈가 있는지를 평가하는 데 사용할 수 있다. 스마트 오더나 라우팅(Routing)에도 사용할 수 있으며 거래소는 표준화된 플랫폼을 통한 솔루션이 가능하다.

자일링스 가속 알고리즘 트레이딩을 사용하는 방법은 판매채널을 통해 알베오 U50과 U250 등을 구매한 다음 소스 코드를 다운로드하면 된다.

에드 라이트 (Ed Wright) 자일링스 아웃바운드 마케팅 디렉터는 “지금까지 클라우드 시장에만 집중했지만, 앞으로는 여러 솔루션 업체들과 협업해 엔터프라이즈 시장에도 적극적으로 공략할 계획”이라며 “2024년에는 스마트 NIC이 전체 NIC 시장에서 70%를 차지할 것으로 예상, 프로그래머블 스마트 NIC 개발에 집중하겠다”고 밝혔다.

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지
이 기사와 관련된 기사