로컬 데이터 인사이트를 위한 Arm의 ‘Cortex-R82’

Cortex-R8 대비 성능 2배 높인 연산 스토리지용 64bit 프로세서

[테크월드=선연수 기자] Arm(암)이 지난 8일 신규 프로세서 ‘Cortex-R82’를 공개했다. 엣지나 서버를 불문하고 인공지능(AI) 연산 성능이 중요해짐에 따라 새로운 성능의 프로세서가 요구되고 있다.

IDC에 의하면, 2025년엔 79제타바이트(zettabytes)가 넘는 IoT 데이터가 존재할 것으로 예상된다. 데이터가 어떤 인사이트를 생산하냐에 따라 데이터의 실질적인 가치가 결정되는 것이다. 더 좋은 인사이트는 우수한 보안, 낮은 지연 시간, 높은 에너지 효율성 등의 성능을 충족함으로써 얻어낼 수 있다. 기업의 중요한 저장고이자 두뇌 역할을 하는 스토리지에 프로세싱 능력을 더한 연산 스토리지가 떠오르는 이유다.

로컬 프로세싱 활용처는?

Arm 스토리지 솔루션 부문 닐 워드뮬러(Neil Werdmuller) 디렉터는 연산 스토리지 활용처로 ‘데이터베이스 가속화’를 꼽았다. 스토리지에서 데이터센터로 데이터가 이동하게 되면 이로 인한 에너지가 소모되고 전달로 인한 지연 시간이 발생한다. 만약 연산 스토리지를 활용한다면, 방대한 데이터를 동시에 병렬적으로 처리할 수 있다. 대용량 파일의 전송 과정을 거치지 않기 때문에 지연 시간이 줄어들고, 전송 과정에서 노출되는 보안 위협으로부터도 안전하다.

연산 스토리지는 특히 머신러닝 기술에 적합하다. 연산 스토리지를 사용하면 비정상적인 상황이 발생했을 때 관련 경고나 통보를 모니터링 시스템에 즉각 알릴 수 있게 된다. 기존에는 데이터를 이동해 분석·처리했으나 데이터 자체에 머신러닝 연산을 직접 적용해 애플리케이션의 새로운 지평을 열 수 있을 것으로 보인다.

64bit의 Cortex-R82

Arm이 새롭게 소개한 Cortex-R82는 Cortex-R 프로세서 중에서는 첫 64bit 제품이다. 64bit로 메모리에 직접 어드레스(Address) 접근할 수 있다. MMU(Memory Management Unit)를 사용 가능한 옵션이 있어, 리눅스나 클라우드 네이티브(Cloud-native) 소프트웨어의 개발에 더욱 적합하다.

Cortex-R8 대비, 작업 부하에 따라 최대 2배의 성능을 기록하는 Cortex-R82는 파트너사들의 소프트웨어가 프로세서상에서 우수한 작동 성능을 보일 수 있도록 돕는다.

64비트 CPU로써 스토리지 애플리케이션에서 데이터 처리 성능 향상을 위해 최대 1TB의 DRAM에 액세스할 수 있다. 이로 인해 8코어에서도 메모리에 대한 일관성을 확보해낸다.

닐 워드뮬러 디렉터는 “Arm 네온(Neon) 기술 옵션을 추가하면 머신러닝과 같은 새로운 워크로드 실행에 있어 지연시간을 줄여 14배가량 빠른 성능을 보인다”고 덧붙였다.

플렉시블한 스토리지 워크로드 구성

[그림 2]에서 왼쪽 그림은 일반적인 스토리지 컨트롤러 구성이고, 오른쪽은 MMU를 적용한 컨트롤러 구성이다. 기존 구성에서는 실시간 워크로드가 구동돼 데이터를 저장하고 데이터에 접근한다. MMU가 적용된 컨트롤러는 데이터 관리뿐만 아니라 연산을 통해 인사이트를 도출해낼 수 있다.

[그림 2] 스토리지 컨트롤러 구성 방식과 수행 능력 비교 (자료=Arm)

기존의 스토리지 컨트롤러는 데이터 저장과 액세스를 위해 베어메탈(Bare-metal), RTOS 워크로드를 실행하는 반면, Cortex-R82는 MMU(Memory management unit) 옵션을 통해 풍부한 운영 체제가 스토리지 컨트롤러에서 직접 실행될 수 있도록 한다.

이를 활용해 고객은 실시간 스토리지 워크로드와 연산 워크로드를 적절하게 배분해 원하는 성능의 연산 스토리지를 꾸릴 수 있다. 리치 OS와 같은 시스템을 스토리지 상에 직접 실행시킴으로써 다양한 소프트웨어 개발 툴을 스토리지 상에 구현할 수 있어 새로운 애플리케이션 분야가 열릴 것으로 기대된다.

닐 워드뮬러 디렉터는 “시스템의 유연성을 이용해 일반적인 워크로드, 언어·라이브러리, 컨테이너·가상화 등에 이어 머신러닝 시스템까지도 스토리지 상에 직접적으로 구현할 수 있다”고 설명했다.

개발 가속화를 위한 지원

Arm은 더 빠른 개발을 돕기 위해 관련 시스템과 프로세서 IP, Cortex-R82 Artisan 물리적(Physical) IP와 POP IP, 개발 스튜디오와 Fast 모델, Cortex-R82 교육과 설계 검토 과정까지 전 솔루션 단계를 지원하고 있다. 엔지니어는 더 강화된 NPU를 사용하고 싶다면 Arm의 NPU를 함께 사용할 수도 있다.

신기술 개발이 이뤄지는 노드가 더욱더 작아짐에 따라 프로그램의 리스크도 높아지고 있다. Arm은 이를 보조하는 최적화 패키지도 함께 제공한다. 이는 면적당 전력 소모와 성능을 최적화할 수 있도록 돕고, 개발 기간을 간소화해주며 리스크는 최소화한다.

기존에 지원되던 컴파일러, 에코시스템, 점검을 위한 사이클 모델 등은 Cortex-R82에서도 활용할 수 있다.

닐 워드뮬러 디렉터는 “전 세계 하드 디스크 드라이브(HDD)와 SSD(solid-state drive)는 약 85%가 Arm의 기술에 기반하고 있다. 수십억 개, 수조 개의 커넥티드 디바이스가 존재하는 세상에서 데이터 프로세싱이 클라우드에서만 수행되는 것은 불가능한 일”이라고 말했다.

이어 “이번에 새롭게 공개한 기술의 연산 스토리지가 발전하기 위해서는 표준화 단계를 거쳐야 한다. 올해 내로 표준을 정립하기 위해 SINA 연산 스토리지 기술 워크 그룹(TWG, Computational Storage Technical Work Group)의 일환으로서 적극 참여 중”이라고 밝혔다.

회원가입 후 이용바랍니다.