콩가텍 COM HPC와 COMe 보드에 12세대 인텔 코어 프로세서 탑재

[테크월드뉴스=서유덕 기자] 고성능 컴퓨터 온 모듈(COM-HPC)과 COM Express(COMe)에 구현된 임베디드 컴퓨팅 분야에 12세대 인텔 코어(Core) 모바일·데스크톱 프로세서가 최근 출시됐다. 혁신적인 성능의 하이브리드 아키텍처가 특징인 이 새로운 하이엔드 임베디드 프로세서는 11세대 인텔 프로세서(엘더레이크) i9, i7, i5, i3 코어보다 뛰어나다.

이 글에서는 고성능 임베디드·엣지 시스템 개발자가 새 모듈로부터 무엇을 기대할 수 있는 지를 알아본다.

사진=게티이미지뱅크
사진=게티이미지뱅크

12세대 인텔 코어 프로세서를 탑재한 새로운 모듈들이 매력 있는 이유는 단지 일반적인 성능을 높인 것 때문만은 아니다. 가장 인상적인 점은 개발자가 모바일(BGA 마운트) 프로세서에서 최대 14개의 코어와 20개의 스레드(Thread, 프로그램 실행 단위)를, 데스크톱(LGA 마운트) 프로세서에서 최대 16개의 코어와 24개의 스레드를 활용할 수 있다는 사실이다. 이는 최대 8개의 코어만 지원했던 11세대 인텔 코어·제온(Xeon) 프로세서 탑재 COMe 6형(Type)과 COM-HPC 클라이언트 A모듈 대비 향상된 멀티태스킹, 병렬 처리, 가상화, 확장성을 제공한다.

물론 코어 수가 두 배 늘었다고 해서 최신 하이브리드 아키텍처가 제공하는 같은 수의 고성능 코어(P코어)보다 두 배 높은 성능을 얻을 수 있는 것은 아니다. 하지만 저전력 코어(E코어)가 부족한 성능을 보완한다. 이 같은 하이브리드 아키텍처는 다양한 임베디드 응용 영역에 몇 가지 이점을 제공한다.

콩가텍 COM-HPC 에코시스템.
콩가텍 COM-HPC 에코시스템.

 

워크스테이션급 산업용 장비

워크스테이션급 산업용 장비는 새 프로세서를 가장 먼저 적용하는 분야다. 초음파 영상을 처리하는 의료 백엔드 시스템부터 영상·음향 데이터를 처리하는 전문 방송·엔터테인먼트 장비에 이르기까지 다양한 영역에 임베디드 프로세서가 필요하다.

철도나 고속도로에서 인명과 재산을 사고로부터 보호하도록 돕는 스마트 비디오 감시 시스템에도 우수한 내구성과 성능을 갖춘 임베디드 프로세서가 필요하다. 워크로드가 많고 다양한 이기종 작업이 병렬로 실행돼야 하는 제어실 장비도 마찬가지다. 이런 시스템이 수행하는 작업은 P코어가 담당해야 하지만 일부 작업은 E코어로 처리해야 효율성을 높일 수 있다.

 

엣지 기기와 모바일 시스템

산업용 장비 외에도, 많은 코어를 내장한 새 인텔 하이브리드 아키텍처가 갖는 성능의 균형성을 활용하기에 적합한 분야가 많다. 이 하이브리드 아키텍처를 적용하기 좋은 예로는 자율주행 물류로봇, 농업용 이동식 기계, 건설·상업용 장비에 탑재하는 엣지 컴퓨터와 사물인터넷(IoT) 게이트웨이가 있다. 또 인공지능(AI) 기반 품질 검사, 공정 자동화, 산업 비전, 실시간 제어를 아우르는 스마트팩토리도 하이브리드 아키텍처의 주요 시장이다. 이런 시스템은 병렬로 실행해야 하는 AI 기반 비전, 실시간 제어, 보안 연결 작업을 위해 여러 가상 머신을 통합한다.

그러나 이 같은 작업이 늘 높은 성능을 요구하는 것은 아니다. 균형있게 리소스(자원)를 할당할 수 있는 하드웨어와 효율적인 스레드 성능이 차세대 컴퓨터 온 모듈(COM)의 시장 판도를 바꿀 것이다.

 

TSN을 포함한 실시간 응용 분야

인텔 스레드 디렉터(Intel Thread Director)는 기본적으로 스레드 성능 밸런싱(분산) 자동 분석·완성 기능(인텔리전스)을 제공한다. 이에 개발자는 특정 코어에 스레드를 수동으로 할당하지 않고 내장된 인텔리전스를 사용할 수 있는데, 이는 30밀리초(㎳, 1㎳는 10-3초)마다 운영체제(OS) 스케줄러에 해당 작업에 가장 적합한 코어에 스레드를 할당하도록 지시한다. 이를 통해 정수, 벡터, AI 작업과 백그라운드 작업을 병렬로 결합하는 실제 응용 프로그램의 작업 능률을 개선할 수 있다.

실시간 응용 분야에서는 결정론적으로 계산하고 빠르게 응답할 수 있도록 OS가 코어 할당을 비활성화할 수 있어야 하기 때문에 자원 할당이 특히 어렵다. 이때 실시간 운영체제(Real-Time Systems) 하이퍼바이저(Hypervisor, 가상 머신 모니터) 같은 기술이 활용된다. 다만 실시간 지원 응용처에 전용 자원을 할당하도록 설계된 적절한 솔루션이 하이퍼바이저 기술을 통해 빠르고 쉽게 구현될 수 있지만, 새로운 프로세서 코어의 동작에 대해 이해하고 있어야 한다. 이에 이 같은 기술에 대한 자격을 미리 갖춰 새로운 x86 하이브리드 아키텍처 적합성 검증을 단순화하는 임베디드 컴퓨팅 플랫폼을 사용하는 것이 좋다[그림 1].

[그림 1] 12세대 인텔 코어 프로세서를 탑재한 콩가텍 컴퓨터 온 모듈은 실시간 운영체제에서 사전 검증된 RTS 하이퍼바이저 구현을 제공해 새 x86 하이브리드 아키텍처 인증을 단순화한다.
[그림 1] 12세대 인텔 코어 프로세서를 탑재한 콩가텍 컴퓨터 온 모듈은 실시간 운영체제에서 사전 검증된 RTS 하이퍼바이저 구현을 제공해 새 x86 하이브리드 아키텍처 인증을 단순화한다.

실시간 시스템은 가상화를 통해 E코어 8개에서 실행될 수 있으며, P코어는 내장된 비전 기술을 기반으로 AI 중심 인식 같은 성능 요구 보조 작업을 처리할 수 있다. 또 단일 프로세서가 인텔 시간 조정 컴퓨팅(TCC)과 시민감 네트워크(TSN) 지원을 포함한 다양한 상황 인식 협동 로봇(코봇)을 통해 프로세서 자체만이 아니라 표준 이더넷 배선을 통해서도 전체 셀에 전원을 공급할 수 있다.

 

단일 플랫폼에서 워크로드 통합

프로세서 활용률에 관한 ‘모든 작업에 대한 단일 개념’을 생각해 보면, 이기종 작업에 대한 시스템 통합 개념이 크게 뒤떨어지지 않는다. 이제 제조 기계 컴퓨터, 서로 다른 컨트롤러, IoT 게이트웨이, 인더스트리4.0이 모두 단일 플랫폼에 통합할 수 있으며, 이를 통해 비용을 절감하고 안정성을 향상시킬 수 있다. 또 실시간 지원 응용 분야를 제외하고 인텔 스레드 디렉터에서 자동으로 자원을 관리해 더 빠르고 효율적으로 작업을 수행할 수 있다.

LGA 타입과 BGA 타입으로 제공되는 새로운 인텔 코어 프로세서는 부가적인 이점을 갖는다. 예를 들어 모바일 BGA 프로세서는 통합된 인텔 아이리스(Iris) Xe 그래픽처리장치(GPU)가 갖춘 최대 96개의 실행 유닛을 제공한다. 이로써 11세대 프로세서보다 최고 129% 향상된 그래픽 데이터 처리 성능을 발휘할 것으로 보이는데, 이를 통해 몰입형 사용자 경험을 구현하고 AI 알고리즘 같은 병렬 워크로드의 처리 속도를 높일 수 있다.

 

94% 빠른 처리 속도, 181% 많은 처리량

LGA 프로세서 기반 모듈의 그래픽 처리 속도는 최대 94% 더 빠르다. 또 AI 탑재 비전 시스템은 이미지 분류 추론을 최대 181% 더 많이 처리해 기존보다 3배 가까이 많은 데이터에 대응할 수 있다. 이 모듈은 그래픽과 GPU 범용 계산(GPGPU) 기반 AI 성능을 극대화하기 위해 이산 GPU를 연결할 수 있는 대규모 대역폭을 갖추고 PCIe 4.0과 5.0 인터페이스를 지원해 속도를 두 배 이상 향상한다.

아울러 데스크톱 칩셋은 추가 연결을 위해 PCIe3.0×8을, 모바일 BGA 모델은 CPU와 칩셋에서 각각 PCIe4.0×16과 PCIe3.0×8을 제공한다. 이 같은 성능 향상 외에도 최대 128기가바이트(GB)의 시스템 메모리를 지원해 하나의 프로세서에서 다양한 시스템을 통합하는 차세대 엣지 워크스테이션 설계자들이 메모리 병목 현상을 걱정하지 않게 됐다.

 

AI, AI, AI

12세대 인텔 코어 프로세서 세대는 윈도우(Windows) ML과 인텔 오픈비노 디스트리뷰션(Intel Distribution of OpenVINO) 툴킷, 크롬 크로스(Chrome Cross) ML을 지원하는 전용 AI 엔진을 내장한다. 그리고 이런 AI 워크로드를 P코어와 E코어, GPU 실행 장치에 원활하게 할당해 집약적 AI 작업을 처리할 수 있다.

인텔 딥러닝 부스트 기술은 벡터 신경망 명령어(VNNI)를 통해 서로 다른 코어를 활용하며, 통합 그래픽은 전용 GPU로 확장 가능한 AI 가속 DP4a GPU 명령을 지원한다. 또 인텔의 저전력 내장 AI 가속기인 인텔 가우스&신경가속기(GNA)3.0이 동적으로 소음을 억제하고 프로세서가 저전력 상태일 때도 음성 명령을 인식한다. 이 같은 기능을 실시간 리눅스(Real-Time Linux)와 윈드리버(Wind River) VxWorks OS에서도 지원한다.

 

다양한 선택지의 COM

콩가텍 같은 임베디드 컴퓨팅 벤더는 높은 대역폭과 성능을 가진 새로운 인텔 코어 프로세서를 기반으로 다양한 버전의 차세대 COM 제품을 생산한다. 설계자는 높은 대역폭으로 설계된 새로운 플래그십 COM-HPC 클라이언트 모듈 표준이나 COMe 타입6 표준을 선택할 수 있다. 두 표준 모두 PCI 산업용 컴퓨터 제조 그룹(PICMG)에 의해 호스팅되기 때문에, 제조사는 두 폼팩터에 대해 동일한 신뢰성과 커뮤니티 지원을 받을 수 있다.

그렇다면 설계자들은 무엇을 선택해야 할까? 기존 응용처는 COMe 타입6을 사용하는 것이 좋다. 반면 새로운 설계, 특히 대역폭과 성능 요구가 증가할 것으로 예측되는 설계는 향후 5~10년 내 COMe의 주요 후속 제품이 될 것으로 예상되는 COM-HPC가 더 적합하다.

하지만 결과적으로 보면 도입된 지 23년이 지난 ETX모듈조차도 지금 여전히 가동되고 있으며 구매할 수 있다. 이처럼 임베디드 컴퓨팅 산업은 제품과 부품 공급이 장기간 이뤄지기 때문에 설계자들은 잘못된 폼팩터 선택을 우려하지 않아도 된다[그림 2].

[그림 2] 개발자는 기존 설계와 잘 호환되는 COMe 타입6이나 새로운 설계에 적합한 COM-HPC 클라이언트 A·C 모듈을 고를 수 있다.
[그림 2] 개발자는 기존 설계와 잘 호환되는 COMe 타입6이나 새로운 설계에 적합한 COM-HPC 클라이언트 A·C 모듈을 고를 수 있다.
Conga-TC670 COMe 타입6 모듈(95㎜×95㎜)과 Conga-HPC/cALP COM-HPC 클라이언트 A모듈(120㎜×95㎜)에 탑재하는 12세대 인텔 코어 프로세서(3종).
Conga-TC670 COMe 타입6 모듈(95㎜×95㎜)과 Conga-HPC/cALP COM-HPC 클라이언트 A모듈(120㎜×95㎜)에 탑재하는 12세대 인텔 코어 프로세서(3종).
Conga-HPC/cALP COM-HPC 클라이언트 C모듈(120㎜×160㎜)에 탑재하는 12세대 인텔 코어 프로세서(4종).
Conga-HPC/cALP COM-HPC 클라이언트 C모듈(120㎜×160㎜)에 탑재하는 12세대 인텔 코어 프로세서(4종).

글: 젤리코 론카릭(Zeljko Loncaric) 마케팅 엔지니어
자료제공: 콩가텍

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지