기쁨과 슬픔, 감정을 표현하는 AI 음성합성 기술 등장
상태바
기쁨과 슬픔, 감정을 표현하는 AI 음성합성 기술 등장
  • 이건한 기자
  • 승인 2019.10.25 10:30
  • 댓글 0
이 기사를 공유합니다

'기쁨', '슬픔', '상냥함', '차분함' 감정표현과 깊이 조절 가능한 음성합성 기술
Selvy deepTTS 제품에 적용·· AI 간 외국어 교차학습도 가능

[테크월드=이건한 기자] 셀바스 AI가 여러 감정을 표현하고, 감정의 강도까지 조절할 수 있는 새로운 음성합성(TTS) 기술을 발표했다. 이번에 공개된 기술은 지난해 출시된 AI TTS 제품인 'Selvy deepTTS'에 적용될 예정이다.

신기술이 적용된 Selvy deepTTS는 ▲차분함 ▲경쾌함 ▲상냥함 ▲슬픔의 4가지 감정을 음성에 추가할 수 있다. 해당 감정들은 뉴스나 쇼핑몰 안내 방송, 오디오북 읽기 등 다양한 감정 표현이 필요한 영역에 사용될 수 있다. 가령 쇼핑몰을 방문한 손님들에겐 경쾌한 음성으로 정보를 전달함으로써, 쇼핑몰 분위기를 보다 밝게 형성하는 것이다. 또 주제나 환경에 따라 '조금 경쾌하게', '많이 경쾌하게'처럼 감정 깊이에 대한 3단계 강도 조절도 가능하다. 

자료=셀바스AI

이와 함께 Selvy deepTTS는 AI 간 외국어 교차언어 학습 기술을 포함하고 있다. 한국어 화자 ‘마루’, ‘유진’, ‘혜진’ 은 영어를, 영어 화자 ‘사라(Sarah)’는 한국어를 구사할 수 있도록 상대방 모국어에 대한 상호 학습이 가능하도록 개발됐다.

셀바스AI는 기존의 음성합성 기술은 모국어 구사만 가능해 다국어 구사가 필요할 경우 해당 언어를 별도로 녹음하거나 다국어를 구사하는 다른 목소리의 화자를 사용해야 했던 것과 비교해 Selvy deepTTS에 적용된 교차언어 학습 기술은 한 명의 AI 화자가 다양한 언어를 사람처럼 자연스럽게 발화할 수 있다고 설명했다.

셀바스 AI 음성합성팀 박태훈 팀장은 “당사의 음성합성 기술은 어떤 텍스트를 입력해도 실시간 음성 합성음 출력이 가능하다"며, "음성기술 개발에 대한 전문성과 기술적 우위를 기반으로 Selvy deepTTS는 개인화된 음성 합성음 구현, 감정과 스타일 표현, 다국어 발화가 가능한 점을 기반으로 다양한 산업에서 맞춤형 음성 기술을 적용해 나가는 중"이라고 말했다.

셀바스 AI는 최근 LG유플러스와 함께 감정합성 기술을 ‘음성합성 기반 통화 연결음’에 적용하기 위한 연구 개발을 진행하기도 했다.