ARMv9, 보안·인공지능 강화하고 특화된 프로세싱 구현

[테크월드뉴스=서유덕 기자] Arm은 3월 31일에 ‘Arm 비전 데이(Vision Day)’ 행사를 열고 ‘ARMv9 아키텍처’를 발표했다. ARMv9은 ‘v8’을 공개했던 2011년 이후 10년만에 출시하는 새로운 아키텍처이며, 보안과 인공지능(AI), 그리고 유비쿼터스 전용 프로세싱에 중점을 뒀다.

‘아키텍처’란 구조를 통칭하는 용어로, 일반적으로는 컴퓨터 시스템의 하드웨어 구조나 기능적 구성 방식을 의미한다. 프로세서, 레지스터, 기억장치, 입/출력 장치 등 하드웨어 구성 요소의 전반적인 기계 구조와 설계 방법을 포함한다.

ARM 아키텍처는 전력 소모량이 낮아 모바일 애플리케이션프로세서(AP)나 마이크로컨트롤러(MCU) 등 임베디드 시스템에 두루 쓰인다. 특히 스마트폰이 보급된 2010년부터 ARM 아키텍처의 점유율이 급격하게 늘었다. 웹 트래픽 분석·통계 서비스 업체 스탯카운터(StatCounter)와 시장조사업체 스태티스타(Statista)에 따르면, 3월 기준 스마트폰 시장의 대부분을 애플(27.4%)과 안드로이드(71.8%)가 차지했으며, 이들 디바이스의 90% 이상이 Arm의 아키텍처를 적용한 저전력 프로세서를 탑재한다.

 

임베디드 시스템과 함께 성장한 ARM

ARM 아키텍처는 RISC 기반의 저전력 설계 덕분에 임베디드 시스템 다수에 적용됐다. 따라서 임베디드 시스템이 확대될수록 ARM 아키텍처도 함께 확산됐다.

컴퓨터 아키텍처는 CISC와 RISC 명령어 구조로 나뉜다. CISC는 명령어의 길이가 가변적이므로, 명령어 밀도를 확보하기가 쉽다. 메모리를 비교적 조금 사용하면서도 많은 정보를 처리할 수 있어 생산성(성능·호환성)이 높다. 다만 구조가 복잡하고 소비 전력이 많다는 단점이 있다. 따라서 데스크탑 컴퓨터 등 고성능 범용 컴퓨팅 장치에 채택된다.

반면 RISC는 명령어의 길이가 일정하다. 이 때문에 밀도를 높일 수는 없지만 해석과 판단을 단순하게 처리한다. 성능(생산성)은 비교적 낮지만, 정보 처리 효율이 높고 소비 전력이 적다. 따라서 특정 목적을 수행할 만큼의 성능만으로 충분하면서도 필요한 전력량을 줄여야 하는 임베디드 시스템에 적합하다.

한편 최근에는 CISC와 RISC의 구별이 희미해지고 있다. 고성능 RISC가 등장해 노트북 CPU 시장으로 폭을 확장하는 등의 변화가 일고 있는 것이다. ARM 아키텍처도 점차 고성능화되면서, ARMv7 이후 제품의 라인업이 고속연산, 실시간, 저비용·저전력의 세 가지로 분류됐다. 그러나 이런 고성능 ARM 아키텍처조차도 소비전력은 겨우 몇 W 수준이며, 범용 CPU나 GPU의 소비전력보다 한참 적다. 따라서 ARM 아키텍처는 점차 고성능화되는 모바일 AP, 통신, MCU 등 임베디드 시스템에서도 급속도로 확산되고 있다.

ARM Cortex 제품군 분류
Cortex-A 고성능, 고속연산 모바일 AP: OS, S/W
Cortex-R 실시간(Real-Time) 통신모뎀, 차량, 의료기기
Cortex-M 저비용, 저전력 MCU: IoT, 가전, 산업용 장비

2월 18일 Arm이 발표한 2020년 4분기 실적에 따르면, 2020년 3분기에만 약 67억 개, 누적 총 1800억 개 이상의 ARM 아키텍처 기반 반도체 칩이 출하됐다. 특히 같은 분기 Cortex-M 프로세서 기반 칩 출하량이 44억 개를 돌파하며 IoT와 통신 부문에서의 입지를 다졌다. 작년 한 해 동안에만 175개의 라이선스 계약을 진행함으로써 Arm은 530개 파트너사와 1910개 라이선스를 계약한 기업이 됐다.

2001~2021년 ARM 기반 반도체 칩 출하량(출처: Arm)
2001~2021년 ARM 기반 반도체 칩 출하량(출처: Arm)

ARM 아키텍처 기반 반도체 칩 출하량의 기하급수적인 증가는 모바일 AP, IoT AP, 차량용 MCU, 전력반도체, 통신칩 등 시장의 확장으로부터 기인한다. 글로벌 시장조사업체 마켓 앤 마켓(Markets and Markets)에 따르면, 전 세계 임베디드 시스템 시장은 2020년 865억 달러로 추정되고 2025년 1162억 달러에 이를 것으로 예상돼 연평균 6.1% 성장할 것으로 전망된다. 2019년 기준, 모바일·IoT AP의 90%와 인포테인먼트·운전보조 등 차량용 시스템 반도체 75%가 ARM 아키텍처를 기반으로 한다. Arm은 네트워킹과 데이터센터·클라우드 부문 점유율을 2028년까지 각각 65%와 25% 이상 수준으로 높이겠다는 전략을 수립했다.

2019년 제품 유형별 ARM 아키텍처 점유율(단위: %, 출처: 소프트뱅크 그룹)
2019년 제품 유형별 ARM 아키텍처 점유율(단위: %, 출처: 소프트뱅크 그룹)

 

모바일 AP의 표준 기술이 된 ‘big.LITTLE’

Arm의 첫 아키텍처 ‘ARM1’는 1985년 아콘 컴퓨터즈(Acorn Computers)의 마이컴(지금의 PC)에 탑재할 CPU를 개발하는 과정에서 탄생했다. 이후 마이컴보다 ARM 아키텍처가 인기를 끌기 시작하자, 아콘은 CPU코어 설계부문을 분사해 VLSI테크놀로지, 애플컴퓨터와의 합작으로 Arm을 설립했다. 이후 Arm은 저전력 SoC(시스템-온-칩) 기반의 CPU 코어 개발에 집중하게 된다. 1998년에는 ARM7TDMI을 발표해 고성능 저전력 마이크로컨트롤러 시장을 점유했고, 이후 ARM9~11을 출시하며 시장 영역을 모바일 등 임베디드 전반으로 넓혔다.

전력 소모가 많아진 고성능 ARM-Cortex-A 시리즈의 전력 대 성능비(전성비)를 높이기 위해, Arm은 2011년 ARMv7을 기반으로 한 Cortex-A7/A15부터 ‘big.LITTLE(빅리틀)’ 기술을 적용했다. 이 기술은 고성능-고발열의 낮은 전성비를 갖춘 코어와 저성능-저발열의 높은 전성비를 갖춘 코어를 하나의 칩에 담아 성능과 전력 효율 사이의 딜레마를 해결한다. 현재 대부분의 모바일 AP가 big.LITTLE 기술을 채택하고 있다.

big.LITTLE의 구동 방식
클러스터 마이그레이션 클러스터
(빅코어 클러스터 or 리틀코어 클러스터)
구현이 쉽다
성능·효율이 낮다
인-커널 스위처(IKS) 가상코어(빅코어1+리틀코어1)
(빅-리틀 코어 혼용 가능)
이기종 간 다중 처리(HMP) 코어
(모든 코어를 한 번에 사용 가능)
구현이 어렵다
성능·효율이 높다

big.LITTLE이 적용된 AP는 빅코어와 리틀코어로 구성되며, 3가지 방법으로 작동한다. 클러스터 마이그레이션은 빅코어(고성능)로 이뤄진 멀티코어 클러스터나 리틀코어(저성능)로 이뤄진 멀티코어 클러스터 중 한 쪽의 코어 클러스터만 사용 가능한 방식이다. 구현이 쉬운 대신 성능과 효율이 낮다. 반면 인-커널 스위처(IKS)는 빅코어와 리틀코어 한 쌍의 가상코어를 구성하고, 각 가상코어별로 작업을 할당하는 방식이다. 구현이 비교적 어려운 대신 성능과 효율이 높다. 옥타코어로 구성한 경우, 최소 4개의 리틀코어 또는 최대 4개의 빅코어를 사용할 수 있다. 이기종 간 다중 처리(HMP) 방식은 클러스터나 가상코어로의 묶음 없이 각 코어를 개별적으로 사용할 수 있으며, 최소 1개의 리틀코어 또는 최대 4개의 빅코어와 4개의 리틀코어를 사용할 수 있다. ARMv8.2부터는 DynamlQ라는 이름의 차세대 기술로 개선돼 활성 코어 수를 더 유동적으로 조절할 수 있게 되는 등 효율성이 향상됐다.

저전력 기반의 연산이 가능해야 하면서도 점차 높은 성능을 요구하는 모바일 AP 시장의 동향에 대응해, Arm은 big.LITTLE로 전력 효율을 유지·개선함과 동시에 성능을 높였다. 이밖에 2011년 10월 ARMv8 아키텍처를 발표하며 ▲연산속도 향상 ▲레지스터 효율 향상 ▲보안성 향상 등 컴퓨팅 환경의 변화를 예견하고 대응하는 기술을 선보였다. 특히 64bit 명령어 세트를 추가하면서도 32bit를 함께 지원하고자 AArch64와 AArch32의 두 가지 실행 상태를 구성했다. 이로써 복잡 다변화하는 컴퓨팅 환경에 대응하고, 연산 성능 향상과 호환성 유지 과제를 함께 해결했다.

 

ARMv9: 연산성능은 물론 ‘보안’과 ‘인공지능’까지 강화

(출처: Arm)
(출처: Arm)

Arm은 CPU 성능 30% 이상 향상 등 범용 컴퓨팅 성능 개선과 함께 전용·특화 프로세싱 성능까지 높이기 위해서 ARMv9에 토탈 컴퓨트 설계 방식을 적용했다. 이 방식은 IP, 소프트웨어, 툴 개발 전반에 최적화를 진행함으로써 제품의 실제 사용 사례와 경험 중심의 개발을 구현한다. 오토모티브, 클라이언트, 인프라, IoT 솔루션에 이 설계 방식을 적용하면 ARMv9의 시스템 수준 기술을 모든 IP 솔루션으로 확장할 수 있다. 이밖에 Arm은 동작주파수, 대역폭, 캐시 크기를 높이면서 메모리 지연 시간을 단축하는 기술을 개발 중이라고 밝혔다. 이런 Arm의 기술은 사용자가 원하는 실질적 퍼포먼스 개선 효과를 체감하도록 할 것이다.

(출처: Arm)
(출처: Arm)

Arm은 보안이 컴퓨팅의 핵심 요소가 될 것으로 전망하고 관련 기술을 강화한다. ARMv9에 적용된 ‘컨피덴셜 컴퓨팅 아키텍처(CCA)’는 ‘보안(Secure)’/’비-보안(Non-secure)’과 분리돼 동적으로 생성된 ‘영역(Realm)’ 개념을 제공하는 하드웨어 기반 보안 기술이다. 이는 처리 중인 상태의 일부 코드와 데이터에 상위권한 소프트웨어(privileged software)까지도 접근·수정이 불가능하도록 보호한다. 이는 실행 환경의 메모리와 주변 장치 등을 보안 영역과 비보안 영역으로 나누는 하드웨어 보안 메커니즘 ‘트러스트존(TrustZone)’을 발전시킨 기술이다. Arm이 기업 임원들을 대상으로 실시한 펄스 설문조사(Pulse survey)에 따르면, 약 90%의 응답자들이 CCA로 보안 비용을 절감함으로써 엔지니어링 투자를 늘릴 수 있을 것으로 기대한다고 답했다.

(출처: Arm)
(출처: Arm)

보안과 함께 급부상하는 컴퓨팅 요소는 ‘인공지능’이다. 스태티스타에 따르면, 2020년 중반에 AI 음성 비서 디바이스 사용량이 80억 회를 넘어선 것으로 추정된다. 이를 반영하듯, Arm이 후지쯔(Fujitsu)와 협력해 개발한 스케일러블 벡터 익스텐션(SVE)의 개선 버전 ‘SVE2’가 ARMv9에 적용된다. SVE2는 5G 시스템, 가상현실, 증강현실의 프로세싱 역량은 물론 이미지 프로세싱이나 스마트홈 애플리케이션 등 CPU에서 로컬로 실행되는 머신러닝(ML) 워크로드의 처리 능력을 강화한다. SVE2가 적용된 ARMv9-A에서는 v7과 v8에서는 볼 수 없었던 128bit 고정 벡터 확장을 지원하며, 이를 기반으로 가변 길이 벡터를 제공해 특정 언어에 국한되지 않는 프로그래밍을 가능하게 만든다. 이밖에 ARMv8의 AArch32와 AArch64 듀얼 구성 실행 환경 등 하위 호환을 지원한다.

리차드 그리센스웨이트(Richard Grisenthwaite) Arm 수석 부사장·설계자 겸 펠로우는 “점점 복잡해지는 AI 기반 워크로드의 요구사항을 충족시키기 위해서 더욱 안전하고 특화된 프로세싱이 필요하게 된다”며, “ARMv9은 개발자들이 신뢰할 수 있는 미래 컴퓨팅 플랫폼을 설계하고 프로그래밍하며, 표준화를 통해 Arm 파트너들이 시장 출시에 소요되는 시간과 비용의 균형을 맞추고 각자 고유의 솔루션을 설계할 수 있도록 지원할 것”이라고 말했다.

 

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지
이 기사와 관련된 기사