2018 자일링스 개발자 포럼(Xilinx Developer Conference)

[테크월드=양대규 기자] 자일링스가 하드웨어 프로그래머블 SoC(System on Chip)인 FPGA(Field Programmable Gate Array)의 새로운 대안을 제시하는 자리를 마련했다. 자일링스는 지난 10월 1~2일 미국 캘리포니아 산호세에서 자일링스 개발자 포럼(Xilinx Developer Conference, XDF)을 통해 업계 최초의 적응형 컴퓨팅 가속화 플랫폼(Adaptive Compute Acceleration Platform, ACAP) ‘Vesal’과 새로운 가속기 포트폴리오 ‘Alveo’를 발표했다.

XDF는 소프트웨어 개발자와 시스템 설계자가 자일링스 엔지니어, 파트너, 업계 리더 등과 함께 지식과 정보를 교류하는 자리였다. XDF에는 자일링스 빅터 펭(Victor Peng) CEO와 주요 임원진들의 발표와 데모 시연, 기술 심화 세션 등으로 구성됐다.

적응형 컴퓨팅 가속화 플랫폼 ‘Versal’

자일링스의 CEO 빅터 펭(Victor Peng)은 XDF 기조연설을 통해 개발자가 애플리케이션에 빠른 혁신을 가져올 수 있도록 지원하는 업계 최초의 ACAP ‘Versal’을 공식 발표했다. 지난 3월 자일링스는 ‘에버레스트(Everest)’ 프로젝트를 통해 ACAP을 공개한 바 있다.

당시 빅터 펭 CEO는 "ACAP은 FPGA가 발명된 이후 산업계와 엔지니어링 성과를 뒤엎을 가장 혁신적인 기술이다. 새로운 아키텍처는 회사의 광범위한 전략의 일부로 FPGA의 한계와 하드웨어 개발자만 지원하는 한계를 뛰어넘는 혁신적인 새로운 구조다. ACAP 제품이 데이터센터를 비롯한 광범위한 시장에서 채택됨으로써 적응형 컴퓨팅의 보급이 가속화되고 지능형, 커넥티드, 적응형 컴퓨팅 세계가 보다 빠르게 현실화될 것”이라고 설명했다.

이번 XDF에서 발표된 Versal은 에버레스트 프로젝트를 통해 만들어진 ACAP의 공식적인 제품명이다. 자일링스는 Versal ACAP은 스칼라 프로세싱 엔진, 적응형 하드웨어 엔진, 지능형 엔진을 최첨단 메모리와 인터페이스 기술에 결합해, 모든 애플리케이션에 강력한 이종 가속 기능을 제공한다고 설명했다. Versal ACAP의 하드웨어와 소프트웨어는 소프트웨어 개발자, 데이터 과학자, 하드웨어 개발자 등에 의해 프로그래밍, 최적화될 수 있으며, 다양한 툴, 소프트웨어, 라이브러리, IP, 미들웨어, 프레임워크로 활성화돼, 이를 통해 업계 표준 설계를 할 수 있다.

TSMC의 7nm 핀펫(FinFET) 공정 기술을 기반으로 구축된 Versal 포트폴리오는 소프트웨어 프로그래머빌리티와 도메인별 하드웨어 가속을 결합한 최초의 플랫폼이다. 제품은 오늘날의 급격한 혁신 속도를 따라가기 위해 필요한 적응성을 제공한다. 포트폴리오에는 클라우드에서 네트워킹, 무선 통신, 에지 컴퓨팅, 엔드 포인트에 이르는 다양한 시장의 각종 애플리케이션에 확장성과 AI 추론 기능을 제공하도록 독창적으로 설계된 6가지의 디바이스 시리즈가 포함된다.

자일링스 CEO 빅터 펭은 "AI와 빅데이터의 폭발과 무어의 법칙 쇠퇴로 업계는 중요한 변곡점에 도달했다. 실리콘의 설계 주기는 더 이상 혁신의 속도를 따라갈 수 없다"며, “4년에 걸친 개발 기간 끝에 발표된 Versal은 업계 최초의 ACAP이다. 자일링스는 모든 유형의 개발자들이 최적화된 하드웨어와 소프트웨어를 사용해 애플리케이션 전체를 가속화하고, 빠르게 진화하는 기술에 발맞춰 이들 모두를 즉시 적응시키도록 독보적인 설계를 구현했다. 업계가 필요로 하는 바로 그 순간에 안성맞춤인 플랫폼"이라고 말했다.

XDF에서 기조연설 중인 자일링스의 빅터 펭 CEO

데이터센터·AI 가속 위한 가속기 카드 ‘Alveo’

XDF에서는 Versal 외에도 자일링스의 새로운 가속기 카드 포트폴리오 ‘Alveo’ 출시를 공식 발표했다. 자일링스는 제품이 클라우드와 온프레미스(On-Premise) 데이터센터 전반에 걸쳐 산업 표준 서버의 성능을 폭발적으로 향상시키도록 설계됐다고 밝혔다. 비디오 처리, 유전체학(Genomics), 데이터 분석, 실시간 머신 러닝 추론과 같은 핵심 데이터센터 애플리케이션을 실행할 때 Alveo를 사용하면, 짧은 지연 시간에 획기적인 성능 향상을 기대할 수 있다는 것이다.

Alveo U200과 Alveo U250은 Xilinx 울트라스케일+(UltraScale+) FPGA를 기반으로 하며, 현재 생산 주문할 수 있다. 또한, 모든 자일링스 기술과 마찬가지로, 고객은 하드웨어를 재구성함으로써 교체 비용을 들이지 않고도 작업량 변경, 신규 표준, 업데이트된 알고리즘을 최적화할 수 있다고 설명했다.

빅터 펭 CEO가 자일링스의 새로운 가속기 카드 Alveo를 소개하고 있다.

Alveo 가속기 카드는 광범위한 애플리케이션에서 중요한 성능상 이점을 제공한다. 머신 러닝의 경우, Alveo U250은 고성능 CPU 대비 실시간 추론 처리량을 20배까지 증가시키고, 0.002초(2ms) 이하의 짧은 지연 시간을 갖는 애플리케이션의 경우에는 고성능 GPU와 같은 고정 기능 가속기 대비 4배 이상 증가시킨다. 또한, Alveo 가속기 카드는 지연 시간을 GPU 대비 3배 단축시켜 실시간 추론 애플리케이션을 실행할 때 상당한 이점을 제공한다. 또한, 데이터베이스 검색과 같은 일부 애플리케이션은 CPU 대비 90배 이상의 성능을 제공하도록 급격히 가속화될 수 있다.

Alveo는 AI/ML, 비디오 트랜스코딩, 데이터 분석, 재무 위험 모델링, 보안, 유전체학 분야에서 주요 애플리케이션을 개발하고, 인증을 획득한 파트너와 OEM 업체들로 구성된 에코시스템에 의해 지원된다. 14곳의 에코시스템 파트너사들이 즉시 배치 가능한 애플리케이션을 개발했다. 이들 파트너사로는 알고-로직 시스템(Algo-Logic System), 빅스트림(Bigstream), 블랙링크스(BlackLynx), CTAccel, 팔콘 컴퓨팅(Falcon Computing), 맥셀러 테크놀로지스(Maxeler Technologies), 밉솔로지(Mipsology), 엔지코덱(NGCodec), 스크린스(Skreens), 썸업 애널리틱스(SumUp Analytics), 타이탄 IC (Titan IC), 비테스 데이터(Vitesse Data), VYUsync, 엑셀레라 테크놀로지스(Xelera Technologies)가 있다. 또한, 델 EMC(Dell EMC), 후지쯔(Fujitsu Limited), IBM 등 상위 OEM 업체들은 자일링스와 협력해, Alveo 가속기 카드를 통해 다중 서버 SKU를 인증하고 있으며, 이런 OEM 업체들은 더욱 늘어날 전망이다.

XDF에 전시된 가속기 카드 ‘Alveo’

자일링스 데이터센터 부문 부사장인 매니쉬 뮤탈(Manish Muthal)은 “Alveo 가속기 카드의 출시와 더불어 자일링스는 플랫폼 회사로 더욱 빠르게 전환되고 있다. 애플리케이션 파트너의 에코시스템이 증가하면서 그 어느 때보다 빠르게 혁신을 이룰 수 있게 됐다” 며, “Alveo 가속기에 대한 고객들의 관심이 높아지고 있으며, 애플리케이션 에코시스템과 협업함으로써, Alveo 기반의 솔루션을 고객에게 제공할 수 있게 된 것을 매우 기쁘게 생각한다”고 말했다.

트위치 “FPGA로 초당 120프레임 제공하는 솔루션 구현”

XDF에서는 자일링스의 신제품 발표 외에도 다양한 연사들이 빅터 펭 CEO의 기조연설에 참여해 개발자들의 시선을 끌었다. 가장 먼저, 트위치(Twitch)의 수석 연구 엔지니어인 웨시 쉔(Yueshi Shen) 박사가 빅터 펭의 기조연설 무대에 합류했다. 쉔 박사는 자일링스의 FPGA 솔루션을 통해 트위치의 스트리밍 수준을 업그레이드했다고 발표했다. 쉔 박사에 따르면, 트위치가 5분 동안 새로운 비디오 인코딩 형식인 VP9를 사용한 업계 최초의 방송 품질 라이브 스트리밍 플랫폼을 구현하기 위해 자일링스 FPGA를 선택했다는 것이다.

트위치(Twitch) 수석 연구 엔지니어 웨시 쉔(Yueshi Shen) 박사

트위치는 전 세계에서 가장 크고 빠르게 성장하는 라이브 스트리밍 비디오 플랫폼이며 게임과 e스포츠(eSports) 콘텐츠를 시청할 수 있는 무료 대화식 네트워크를 제공한다. 트위치 커뮤니티는 수백만 명의 시청자와 스트리머에게 높은 사양의 라이브 스트리밍 경험을 보장해야만 했다. 쉔 박사는 버퍼링과 초-저(Super-Low) 대기 시간의 방송 품질 비디오를 제공하는 것이 중요하다고 말했다.

트위치는 플랫폼의 까다로운 뷰어 기반 요구를 충족시키기 위해 자일링스 애플리케이션 파트너인 NGCodec의 인코더 IP로 개발된 새로운 VP9 인코딩 표준을 사용해 자일링스 구동 솔루션을 구현했다. 쉔 박사는 “자신의 팀이 초당 60프레임의 인코딩 요구 사항을 처리할 수 없는 CPU를 포함한 많은 옵션을 검토했으나, 실제로 서버 클래스 CPU는 초당 4프레임 수준밖에 처리할 수 ​없다”며, “자일링스 울트라스케일(Xilinx UltraScale) + FPGA를 기반으로 한 AWS F1 FPGA 인스턴스의 서버 구현은 단일 FPGA에서 초당 120프레임을 제공하는 솔루션을 구현해 CPU보다 30배 뛰어난 성능을 구현했다”고 설명했다.

쉔 박사는 “트위치의 경험은 몰입과 상호 작용이 중요하다. 트위치 시청률은 매우 빠르게 증가하고 있다”며, “다행히도 자일링스 기술은 트위치와 같은 기업이 빠르게 혁신을 진행할 수 있게 해준다”고 강조했다.

FPGA를 도입한 트위치는 최대 수요 이상의 데이터센터를 구축해, 지난 월드컵을 방송하는 데 필요한 대역폭과 거의 동일한 대역폭 수치인 18TB/s를 요구하는 300만 명의 동시 사용자를 만족시켰다. 쉔 박사는 “우리는 전체 스트리밍 산업에서 VP9, ​​FPGA, AWS F1의 도입을 진지하게 고려하는 것을 추천한다”며, 트위치가 이번 결과에 매우 만족하며 기술 커뮤니티와 공유하고 싶다고 밝혔다.

AMD “AMD EPYC, Alveo·Versal 등 자일링스 가속기 라인업에 지속적으로 협업”

트위치에 이어, 빅터 펭의 기조연설에는 AMD CTO인 마크 페이퍼마스터(Mark Papermaster)가 합류했다. 마크 페이퍼마스터는 AMD와 자일링스가 AMD EPYC CPU에 새로운 Alveo 가속기를 연결해 고성능의 실시간 AI 추론 처리를 위해 협력하고 있다고 밝혔다. 그는 이를 통해 세계 최고 기록인 3만 이미지/s의 추론 처리량을 보여줬다고 강조했다.

Alveo 에코 시스템 영역에 탑재될 시스템은 PCIe 커넥티비티를 갖춘 2개의 AMD EPYC 7551 서버 CPU와 새로 발표된 자일링스 Alveo U250 가속기 8종을 활용한다. 추론 성능은 개발자가 가속화된 추론을 최적화, 배포하고 텐서플로(TensorFlow)와 같은 기계 학습 프레임 워크를 지원할 수 있게 해주는 ‘Xilinx ML Suite’에 의해 제공된다.

AMD CTO 마크 페이퍼마스터(Mark Papermaster)

마크 페이퍼마스터 CTO는 “AMD와 자일링스는 이질적인 시스템 아키텍처로의 컴퓨팅 진화에 대한 공동의 비전을 공유했으며 기술 협력에 대한 오랜 역사를 가지고 있다”며, “양사는 드라이버를 최적화하고 AMD EPYC CPU와 자일링스 FPGA 간의 상호 운용성 성능을 조정했다. 우리는 업계 종사자들과 협력해 여러 프로세서에서 캐시 일관성과 공유 메모리를 활성화하는 데 중점을 둔 가속기에 대한 일관된 상호 연결에 대해 협업하고 있다”고 설명했다.

그는 AMD EPYC에 대해 “(제품은) 인공 지능과 고성능 컴퓨팅 작업을 가속화하는 완벽한 CPU 플랫폼”이라며, “업계 최초의 하드웨어 임베디드 x86 서버 보안 솔루션과 결합 된 32코어, 64스레드, 8 메모리 채널(소켓 당 최대 2TB 메모리, 128 PCIe 레인)을 갖춘 EPYC는 메모리 용량, 대역폭, 프로세서를 제공하도록 설계됐다. 코어를 통해, AI와 HPC에서 흔히 볼 수 있는 메모리 집약적인 작업 부하를 효율적으로 실행한다. EPYC를 통해 고객은 더 큰 데이터 세트를 훨씬 빨리 수집하고 분석해 복잡한 문제를 크게 가속화 할 수 있다”고 밝혔다.

자일링스와 AMD는 앞으로도 기술 제휴를 지속할 전망이다. AMD EPYC 서버와 그래픽 프로세서를 Alveo 가속기 외에도, Versal 포트폴리오를 통해 자일링스 가속 플랫폼과 연계시키는 로드맵에서 지속적인 제휴가 있을 것이라는 계획이다.

XDF 이모저모1
XDF 이모저모2
XDF 이모저모3
회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지