딥러닝 기반 음성인식 엔진 공급
소음 환경과 저품질 오디오서도 인식률 높아

[테크월드=김경한 기자] 스켈터랩스는 음성인식 엔진 AIQ.TALK STT(Speech-to-Text)를 GS 숍에 공급해 쇼핑호스트 음성인식 시스템을 구축한다.

스켈터랩스는 AIQ.TALK STT를 적용해 라이브 방송 심의용으로 GS 숍 쇼핑호스트의 음성을 실시간 텍스트로 변환하는 시스템을 구축한다. 구체적으로는 GS 숍 특화 음성인식 모델과 운영·관리 프로그램을 개발하고, 학습 툴을 통한 지속적인 인식률 향상을 진행할 예정이다. 구축된 시스템은 이후 판매 상품에 대한 데이터베이스 확대, 개인화된 상품 추천, 심의 자동화 등 GS 숍의 다양한 디지털 트랜스포메이션 과제에 활용될 예정이다. 

스켈터랩스 음성인식 엔진 AIQ.TALK STT는 딥러닝(Deep learning) 기반의 음성-언어모델로, 사람 간의 대화 문맥을 이해해 부정확한 발음이나 방언에 대해서도 정확히 인식한다. 특히 배경음악이 나오는 장소에서 여러 명이 말하거나, 소음이 심한 환경에서의 음성, 낮은 품질의 오디오 등에서 음성인식 정확도가 높다. 

GS 숍의 신석한 팀장은 “최신 AI 기술을 도입한 스켈터랩스의 음성인식 엔진은 타사 대비 적은 양의 학습 데이터로도 월등히 높은 성능을 보였다"며, “자체 자연어이해와 처리 기술이 적용된 언어모델을 보유하고 있기 때문에 협업을 통해 지속적으로 시스템을 향상시킬 수 있을 것으로 기대한다"고 말했다.  

한편 스켈터랩스는 AIQ.TALK STT를 온프레미스(On-premise, 구축형), SaaS(Software as a Service, 서비스형 소프트웨어) 두가지 형태로 모두 제공한다. 음성인식을 음성합성(Text-to-Speech)과 자연어이해·처리 기술과 결합한 보이스봇(Voicebot), 기계독해(Machine Reading Comprehension, MRC)와 결합한 동영상·오디오 검색 서비스 등으로 다양하게 패키지화해 선보이고 있다.

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지
이 기사와 관련된 기사