높은 확장성·범용성 갖춘 머신러닝 컴퓨팅 플랫폼 제공

[테크월드=정환용 기자] Arm이 ‘프로젝트 트릴리엄’(Project Trillium)을 발표했다. 프로젝트 트릴리엄은 높은 확장성을 갖춘 새로운 프로세서들을 포함한 Arm IP 제품군으로, 향상된 머신러닝(Machine learning)과 신경망(Neural Network) 기능을 제공한다. 현재 기술들은 모바일 시장에 중점을 두고 있지만, 최첨단 객체 인식 기능을 포함한 첨단 컴퓨팅 기능을 통해 새로운 수준의 ML 탑재 디바이스를 구동시킬 수 있게 된다.

Arm의 IP 제품 그룹 대표 르네 하스(Rene Haas)는 “인공지능이 엣지 디바이스에 적용되는 속도가 빨라짐에 따라, 전력 효율성을 유지하면서 충분한 컴퓨팅 성능을 제공하는 것이 점점 어려워지고 있다. 이런 요구를 충족시키기 위해 Arm은 새로운 ML 플랫폼인 ‘프로젝트 트릴리엄’을 발표했다”며, “새로운 디바이스에는 이런 최신 프로세서가 제공하는 고성능 머신러닝과 인공지능 기능이 필요할 것이고, 파트너사들은 Arm 플랫폼이 제공하는 높은 수준의 유연성과 확장성을 활용해 다양한 디바이스에서 구현할 수 있는 범위를 확장할 수 있을 것”이라고 덧붙였다.

현재 머신러닝 기술은 특정 디바이스 종류나 특정 요구사항에 집중하는 경향이 있다. Arm의 ‘프로젝트 트릴리엄’은 높은 확장성을 제공해 이런 현상에 변화를 가져온다. 초기에 출시된 Arm 머신러닝 제품은 모바일 프로세서에 초점을 맞췄지만, 향후에는 센서나 스마트 스피커, 홈 엔터테인먼트, 그리고 그 이상을 아우르는 적절한 성능을 제공할 것이다.

Arm의 새로운 머신러닝과 객체 인식 프로세서는 기존 CPU, GPU, 가속기(accelerators)와 비교해 효율 향상을 가져올 뿐만 아니라, 전형적인 DSP를 능가한다. Arm 머신러닝 프로세서는 처음부터 철저하게 머신러닝 전용으로 설계됐다. 이는 확장성이 뛰어난 Arm 머신러닝 아키텍처를 기반으로 하며, 응용 프로그램의 성능과 효율성을 극대화한다.
▲모바일 컴퓨팅의 경우, 프로세서는 초당 4.6조 회 이상의 연산 수행
▲지능형 데이터 관리를 통해 실제 응용 프로그램에서 2배에서 4배가량 높은 유효 처리량(TOPs) 제공
▲발열과 비용이 제한된 환경에서 소비전력당 초당 3조 이상 연산(TOPs/W) 효율성을 제공하는 성능 발휘

Arm 객체인식(Object Detection) 프로세서는 사람과 기타 사물을 효율적으로 식별하도록 특수 설계됐다. 프레임 당 식별할 수 있는 사물의 수는 무한대에 가깝다.
▲초당 60프레임의 속도로 FHD 해상도 실시간 식별
▲기존 DSP 성능 대비 최대 80배까지 높이고, 이전 Arm 기술에 비해 식별 능력 크게 향상

Arm의 머신러닝, 객체인식 프로세서는 높은 성능과 전력 효율을 갖춘 사람 식별·인식 솔루션을 제공한다. 이는 스마트 디바이스에서 저전력, 고해상도의 상세한 얼굴 인식 기능을 실시간으로 수행할 수 있게 한다.

Arm 신경망 소프트웨어는 Arm 컴퓨트 라이브러리(Arm Compute Library)와 CMSIS-NN과 함께 사용될 경우 NN에 최적화된다. 텐서플로우(TensorFlow), 카페(Caffe), 안드로이드 NN과 같은 신경망 프레임워크와 모든 Arm 코어텍스(Cortex) CPU, 말리(Mali) GPU, 머신러닝 프로세서를 자연스럽게 통합해 준다. 개발자는 Arm 기반 하드웨어 기능을 최대한 활용해, ML 응용 프로그램에서 높은 성능을 얻을 수 있다. 새로운 Arm 머신러닝 IP 제품군은 2018년 4월에 시연할 수 있고, 2018년 중순에 출시될 예정이다.

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지