[테크월드뉴스=서유덕 기자] 과학기술정보통신부(이하 과기정통부)는 한국과학기술원(KAIST) 유회준 교수 연구팀(제1저자 이주형 박사과정)이 심층 강화학습(DRL)을 높은 성능과 전력효율로 처리할 수 있는 첨단 인공지능(AI) 반도체 기술을 개발했다고 16일 밝혔다.
DRL은 지난 2016년 바둑 프로기사 이세돌 9단과 대국한 구글 딥마인드의 알파고에서 활용됐던, AI가 스스로 최적의 답안을 도출하면 사람이 그에 대한 피드백을 주는 학습 방식이다. 정답이 주어지지 않은 상황에서 최적의 답을 빠르게 찾아야 하므로, 이는 여러 개의 신경망을 동시에 사용하는 특징을 보인다.
신경망이 복잡하게 얽혀있고 대규모의 데이터를 처리해야 해 기존에는 대용량 메모리를 가진 고성능 컴퓨터 여러 대를 병렬 활용해야만 DRL을 구현할 수 있었다. 따라서, 노트북이나 스마트폰 등 엣지 디바이스에서는 그 구현이 거의 불가능했다.
유회준 교수 연구팀은 모바일 기기 등에서도 심층 강화학습이 가능하도록 기존 대비 성능이 우수하고 전력효율이 2.4배 높은 인공지능 반도체 기술 ‘OmniDRL’을 개발했다. OmniDRL에는 ▲심층 신경망 데이터에 대한 압축률 증가 ▲데이터 압축 상태에서 연산 ▲연산(프로세서)·저장(메모리) 기능이 통합된 SRAM 기반의 PIM(Processing-In-Memory) 반도체 기술이 적용됐다. 이를 통해 연산에 불필요하거나 중복된 데이터 개수를 줄이고, 압축 해제가 필요하지 않은 데이터 연산을 구현해냈다. 이로써 DRL에 사용되는 심층 신경망의 부동소수점 연산을 저전력으로 처리하고, 고압축률을 유지하면서 추론뿐만 아니라 학습까지도 엣지에서 수행 가능하게 될 전망이다.

연구팀은 OmniDRL을 심층 강화학습 알고리즘의 성능 비교 연구에 주로 활용되는 ‘인간형 로봇 적응 보행 시스템’에 적용한 결과, OmniDRL이 연결되지 않았을 때보다 7배 이상 빠른 속도로 적응 보행이 가능하다는 결과를 얻었다.
유회준 교수는 “이번 연구는 한 개의 반도체에서 심층 신경망을 높은 압축을 유지한 상태로 추론 및 학습을 가능하게 했고, 특히 불가능이라 여겨졌던 소수점 연산이 가능한 인공지능 반도체 기술을 개발했다는 점에서 의미가 크다”며 “향후 지능형 로봇 조종, 자율주행 드론, 게임 등 다양한 분야에 응용이 가능할 것으로 기대된다”고 연구의 의의를 설명했다.
그래도 삭제하시겠습니까?



