CEVA, 신경망 네트워크 기반 음성인식 기술 WhisPro 발표
상태바
CEVA, 신경망 네트워크 기반 음성인식 기술 WhisPro 발표
  • 박진희 기자
  • 승인 2019.01.14 11:07
  • 댓글 0
이 기사를 공유합니다

[테크월드=박진희 기자] 스마트 커넥티드 디바이스용 시그널 프로세싱 플랫폼 AI 프로세서의 선두 라이선스 기업인 CEVA가 신경망 네트워크를 기반으로 한 음성인식 기술 WhisPro를 14일 발표했다. 

WhisPro는 ‘음성 인식 기술’을 지원한다. 음성(Voice)은 지능형 클라우드를 기반으로 한 서비스 엣지 디바이스 사용시 효과적인 입력 수단으로 여겨지며, 진보된 휴먼 인터페이스(Human Interface, 키보드로 글자를 하나하나 입력하는 대신 말이나 글씨 또는 촉각으로 쉽게 컴퓨터를 조작하고 데이터를 입력할 수 있는 기술)의 입력 수단으로 널리 사용된다. 

CEVA의 저전력 음성 오디오 신호처리에 대한 방대한 전문성을 활용한 WhisPro는 상시 청취형 멀티-트리거 프레이즈 인식 기술(Always-listening Multi-trigger Phrase)로써, 새로운 스마트폰, 스마트 스피커, 블루투스 이어폰 기타 음성 지원 디바이스의 사용자가 아마존 알렉사, 구글 어시스턴트, 바이두 DuerOS 등의 클라우드 기반 음성 비서(Voice Assistant)와 상호 호환돼 동작할 수 있도록 지원한다.

또한, CEVA는 고객에게 자동차, 스마트홈, 엔터프라이즈 등을 포함한 다양한 유스케이스 엔드 마켓에 자신만의 음성 제어를 적용시킬 수 있는 트리거 프레이즈 커스터마이징 서비스(Trigger Phrase Customization Service, 작동 문구 맞춤화 서비스)를 제공한다. 지난주 라스베가스에서 열린 CES2019에서 이 기능을 탑재한 WhisPro를 선보였다.

WhisPro는 CEVA의 ClearVox 프론트-엔드 음성 신호처리 소프트웨어 기술(Front-end Voice Processing Software)과 함께 작동하며, 고객에게 CEVA DSP를 기반으로 한 견고한 음성인식용 하드웨어 소프트웨어 솔루션을 제공한다. 이러한 음성신호 전처리 기술과 신경망 네트워크 알고리즘의 총체적 통합은 컴퓨팅 리소스 전력을 최소한으로 소모함과 동시에 95% 이상의 높은 인식률을 실현한다.

이 기술은 시끄러운 환경 속에서도 근거리 원거리 모두에서 선명한 복원력을 보여준다. 뿐만 아니라 클라우드 백업 없이 엣지 디바이스에서 바로 작동하므로 사용자 프라이버시가 보호되고, 지연이 최소화 된 즉각적인 응답을 제공한다.

음성 AI 기술을 기반으로 엣지 디바이스용으로 최적화된 WhisPro의 재귀 신경망 네트워크 기술은 다중 트리거 프레이즈를 동시에 인식 할 수 있다. WhisPro SDKit은 시스템 상에서 WhisPro 기술을 통합하고 테스트 하기 위한 가이드라인과 툴을 고객에게 제공한다. 고객의 요청에 따라 키워드와 다중 언어에 대한 다중 발음을 지원하며 현재는 영어만 지원되고 있지만 곧 중국어를 지원할 예정이다.