[테크월드=선연수 기자] 네이버가 뉴스 기사 본문을 읽어주는 서비스에 오상진 전 아나운서의 목소리를 활용했다.

 

이번에 새롭게 적용된 뉴스 기사 본문 읽기 서비스는 기존의 UTS(Unit-selection Text-to-Speech) 기반 서비스 대비 MOS(Mean Opinion Score) 지표가 30% 이상 높아졌다. MOS 지표는 목소리의 자연스러움을 평가하는 지표다.

네이버는 기존 클로바 인공지능 음성합성 기술인 nVoice 를 개선했다. 오상진 전 아나운서의 목소리를 기반으로 개발한 AI 앵커의 목소리를 특정 분야에 전문화된 목소리 특성을 강화하고, 사람 본연의 목소리에 가까운 고품질 합성음을 만드는 HDTS(High-quality DNN Text-to-Speech) 기술도 업그레이드해 보다 뉴스에 최적화된 음성을 합성해냈다.

뉴스 읽기 분야에 전문화된 목소리의 특성을 강조해 만들어진 합성음인 만큼, 실제 앵커가 기사를 전달하는 목소리 톤(Tone)과 높낮이까지 구현해냈다.

일련의 과정에서 사람이 아닌 기계가 전사(Transcription) 작업을 직접 학습하는 딥러닝(Deeplearning)이 적용돼, 개발에 필요한 비용과 소요 기간을 획기적으로 줄일 수 있었다고 네이버는 설명했다. 향후 네이버 지도, 음성검색, 클로바를 탑재한 스마트스피커 등에도 AI 앵커가 활용될 예정이다.

김재민 네이버 클로바 보이스 책임리더는 “이번 작업 과정에서는 오상진 전 아나운서가 직접 뉴스를 읽어주는 것과 같은 자연스러움을 느낄 수 있을 정도의 고도의 정밀함과 전문성을 구현하는 것에 더욱 집중했다”고 개발 목표를 설명했다.

이 기사를 공유합니다
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지
이 기사와 관련된 기사