아이폰에서 통화 내용 녹음 기능도 제공

[테크월드=김경한 기자] 그랜드뷰리서치(Grand View Research)는 글로벌 음성인식 기기 시장이 2025년에 318억 2000만 달러(약 37조 66억 원)에 달할 것이며, 연평균 성장률은 17.2%를 기록할 것으로 전망했다. 국내에서도 인공지능(AI) 스피커, 스마트 가전, 인공지능 콜센터 등의 도입으로 음성인식 서비스의 수요가 증가하고 있다. 

이런 가운데 아틀라스랩스가 높은 음성인식률은 물론, 유형 분류, 답변 추천 등 다양한 응용 기술을 내놓은 제품을 내놓았다. 더군다나 스위치라는 제품을 통해선 아이폰의 통화 내용을 녹음할 수 도 있다. 다음은 차별화된 제품과 기술력에 대해 소개한 류로빈 아틀라스랩스 대표와의 서면인터뷰 내용이다. 

류로빈 아틀라스랩스 대표

Q. 음성인식 제품을 내놓은 계기는 무엇인가?

2015년부터 11월 미국 법인을 설립했다. 그러면서, 한국, 싱가포르, 일본과 같은 아시아 시장에 주목했는데, 2016년 이세돌과 구글 알파고의 바둑대결을 계기로 한국에서도 AI 분야에 대한 관심이 높아지는 것을 보고 한국 지사를 설립했다. 

항상 AI가 우리가 사는 세상을 개선, 발전시킬 수 있는 기술이 무엇일지 고민했다. 그러던 중, 인간과 기계가 자연스럽게 대화하고, 서로 상대방을 이해하기 위해서는 음성인식 기술의 발달이 필수적이라고 생각했다. 
그런데 이 분야를 분석해 보니 현 시점 기술의 한계점도 알 수 있었다. 전화로 통화하는 사람과 사람이 대화하는 상황에서는 음성인식 기술이 잘 작동하지 않는다는 걸 발견한 것이다. 이때부터 아틀라스랩스 개발진은 사람 대 사람의 대화 내용을 잘 인식할 수 있는 기술 개발에 나섰다. 

특히 영업사원, 사업개발인력, CS 직원, 텔레마케팅, 에이전시, 간호사, 의사 등 다양한 직업군에서 일하는 사람들의 샘플을 수집하는 데 집중했다. 질문 내용도 “현재 뭐가 제일 힘드세요?”, “업무 진행 시 어떤 일이 시간이 가장 많이 걸리세요?”와 같이 일상적으로 하는 대화를 많이 모았다.

그러면서 음성인식 기술이 앞으로는 데이터 관련 분야로 응용될 것이라는 분석 하에, 음성인식뿐만 아니라, 녹음과 기록, 추천 등 고객이 통찰(Insight)을 얻을 수 있는 솔루션이 개발돼야 한다는 점을 느꼈다. 이후 임직원들이 합심해서 차별화된 제품을 내놓기 위해 연구개발에 매진했으며, 2018년 2월 한국어 음성인식 오픈소프 프로젝트 제로스(Zeroth)를 시작할 수 있었다. 현재는 아이폰으로 통화한 음성을 데이터로 바꿔주는 스위치(Switch)를 앱스토어에 출시한 상태다. 

 

Q. 아틀라스랩스의 제품에 대해 구체적으로 설명해 달라. 

먼저, 제로스 EE(Zeroth Enterprose Edition)는 실시간 모듈 2000시간 음향 모델을 지원하며 어떤 비즈니스에도 최적화해 적용할 수 있는 B2B 기반 솔루션이다. 주요 기능으론 STT(Speech-to-Text, 음성을 텍스트로 변환), 실시간 음성 인식, 멀티 채널 지원, 구문 힌트 등의 음성인식(Automated Speech Recognition) 기술과 개체명 추출, 의도 감지, 유형 분류, 검색 기반 추천 답변 등의 자연어 이해(Natural Language Understand) 기술을 갖추고 있다. 제로스 EE는 CPU만으로 디코딩할 수 있어 빠르고 정확하게 동작하고 GPU에 대한 비용이 감소하는 강점도 있다. 

올해 4분기(11월 말, 혹은 12월 초)에 안드로이드 플레이스토어에도 출시할 예정인 스위치는 전화 내용을 데이터로 바꿀 수 있는 앱이다. 아이폰에서도 전화 내용 녹음과 기록이 가능한 기능도 보유하고 있다. 

이 앱은 전화 통화를 하면 그 내용을 자동으로 녹음하며, 상대방과 통화가 끝난 후에는 바로 텍스트로 기록한다. 단, 스위치에서 통화 내용을 녹음하거나 텍스트로 기록하기 위해선 AI 번호를 사용해야 한다. 스위치 앱을 다운받은 후 가입 시에 070번호를 발급받는데, 이 번호가 불편하다면 010 번호를 발급받을 수도 있다. 

 

Q. 애플은 개인정보 보호 문제로 아이폰으로 통화한 내용을 녹음할 수 있는 기능을 삭제한 것으로 알고 있다. 그런데 스위치는 이를 역행하는 기술을 탑재했는데 이에 따른 문제는 없는가?

애플과는 이미 협의해서 승인을 받은 상태라 법적인 문제는 없다. 앱 제공업체가 앱스토어에 자사 제품을 올리려면 먼저 애플과 논의해야 하기 때문에 이 문제는 애플과 충분히 논의와 검토의 과정을 거쳤다. 그 과정에서 데이터를 암호화하고 유저만 데이터를 볼 수 있으며, 녹음 시에는 안내를 통해 녹음된다는 표시를 상대방에게 알려주는 기능을 탑재했다. 

스위치가 아이폰에서 통화 내용을 녹음할 수 있는 기술적 비밀은 음성을 스마트폰 내에서 녹음하는 것이 아니라 네트워크와 연동해서 자체 서버에 녹음하는 데 있다. 네트워크 상으로 녹음을 하다보니 타 음성인식 앱에서는 해결하지 못한 문제도 해결할 수 있게 됐다. 

스위치의 실시간 통화 기록 모습

그 덕분에 스위치는 통화 내용을 자체 디바이스에 녹음할 경우 발생하는 문제점도 해결할 수 있었다. 자체 디바이스에 녹음하는 경우, 통화하는 사람의 목소리가 겹칠 시에는 이를 구분하지 못하게 된다. 때문에 통화 내용을 텍스트로 기록할 때 오류가 발생한다. 일반적으로 이를 화자분리(Speaker Separation)라고 하는데, 사람의 목소리를 구분하지만 인식률의 정확도는 떨어질 수밖에 없다. 하지만 네트워크와 연동하는 스위치는 통화 내용 녹음 시 사람(디바이스) 별로 따로 데이터를 추출해서 녹음하므로 이런 문제가 발생하지 않는다. 

 

Q. 자체 통신 서버를 운영한다면 비용이 만만치 않을 것 같다. 비용 문제는 어떻게 해결하는가?

통신 서버를 직접 운영하기 때문에 추가 비용이 발생하는 건 사실이다. 이 문제를 해결하기 위해 아틀라스랩스는 유료 구독 서비스를 진행할 예정이다. 고객은 아틀라스랩스의 통신 네트워크를 얼마나 사용했는지에 따라 비용을 지불하게 된다. 

향후에는 카카오톡과 같은 무료 서비스도 진행할 예정이다. 카카오톡이 출시된 초창기에는 이 앱을 사용하려면 상대방도 동일 앱을 설치해야 한다는 것에 불편함을 호소하는 이들도 있었다. 하지만 문자를 공짜로 주고받을 있다는 사실을 알게 되자 유저의 반응은 긍정적으로 바뀌었다. 스위치도 무료 서비스를 통해 고객에게 새로운 가치를 창출하고 신사업 모델을 창출하는 계기를 만들고자 한다. 

 

Q. 아틀라스랩스의 음성인식 기술 협업 사례를 소개해 달라. 

아틀라스랩스는 16kHz(인터넷 회선), 8kHz(전화선)의 오디오에 관한 모든 프로젝트 수행 경험이 있다. 다양한 분야에서 음성인식 기술을 도입해 활용한 레퍼런스도 보유해 자사의 기술과 제품을 찾는 고객이 늘고 있다. 

포스코 ICT와는 기술 라이센싱으로 협업하고 있다. 포스코 ICT는 아틀라스랩스의 음성인식 라이센스를 포스코 그룹 운영회의, 이사회, 강연·세미나·교육의 동영상 파일과 녹음파일을 텍스트로 변환할 때 사용하고 있다. 철강, 건설, IT 등 주요 그룹사의 도메인 언어 학습을 통해 최적화 모델을 생성했으며, 음성 콘텐츠에 대한 검색, 텍스트 마이닝 분석에 활용 중이다. 

예스24는 에는 제로스 EE를 활용해 음성 검색 서비스를 제공한다. 모바일 앱에서 사용자가 음성 검색을 통해 상품을 구매할 수 있는 서비스를 제공하고 있으며, 도메인 최적화 없이 아틀라스 기본 모델로 음성 인식률이 91.5%를 달성했다. 

오뚜기는 주문 접수 처리 시에 아틀라스랩스의 기술을 활용한다. 기존에 식당에서 오뚜기 상담원에게 전화를 걸어 직접 식자재 주문을 받는 방식을 탈피해, 음성으로 주문 접수를 처리하는 음성봇의 STT 부분에 제로스 EE 엔진을 사용하고 있다. 오뚜기 데이터를 통한 도메인 최적화 결과 음성 인식률은 90.58%를 기록했다. 

KTds는 AI 상담 STT에 제로스 EE 엔진을 사용하고 있다. 도어락을 판매하는 아이레보의 콜센터에 걸려오는 AS 관련 상담 전화 응대 시 상담원이 더 효율적으로 고객 응대를 할 수 있도록 KT DS의 AI Centro라는 지능형 컨택센터 시스템 중 STT 부분을 담당한다. AI 상담 시 고객과의 통화 내용을 텍스트로 변환하고 대화내용을 분석해 고객의 문의 사항에 알맞은 답변을 상담원에게 실시간으로 추천하며, 상담이 종료되면 상담 내용을 자동으로 요약·분류하는 기능도 포함된다. 

 

Q. 현재 애플 앱스토어에서 서비스 중인 스위치를 구글(안드로이드) 플레이스토어에서도 올해 4분기에 출시 예정이라고 밝혔다. 그 외 향후 사업계획은?

스위치 앱에 대한 B2B 사업을 준비하고 있다. 이 앱은 현재 개인이 쉽고 편하게 사용할 수 있는 서비스다. 향후에는 추가로 회사에서 팀 차원에서 관리할 수 있는 서비스도 제공할 예정이다. 예를 들어, 여러 명의 영업사원 조직 내에서 스위치를 통해 서로의 거래처 전화번호를 기록·관리하며, 교육 정보도 교환하고, 고객불만도 체크할 수 있는 비즈니스 툴을 개발하고 있다. 

이에 더해 일본 진출 계획도 있다. 현재 일본어 공부를 하고 있으며, 2021년 1분기 정도면 진출에 대한 윤곽이 잡힐 것으로 보인다. 

아틀라스랩스는 대화의 가치가 소중하다고 믿고 있다. 이에 앞으로도 실시간 대화의 가치를 높이기 위해 AI 기술을 연구하고 발전시켜 인간의 삶을 가치 있고 풍요롭게 하는 데 일조하고자 한다. 

이 기사를 공유합니다
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지
이 기사와 관련된 기사