[테크월드=정환용 기자] 미국의 정보 기술 연구 및 자문회사 가트너는 매년 기업들이 주목할 만한 10가지 전략 기술을 선정해 발표한다. 가트너는 이 자료에 대해 도입 단계를 벗어나 영향력이 확대되고 있는, 잠재적인 성장 가능성이 큰 기술의 트렌드라고 설명하고 있다.

인공지능과 고급 머신러닝에 이어 가트너는 ‘지능형 앱’(Intelligence Apps)을 언급했다. 가상의 개인 비서 역할을 지향하는 지능형 애플리케이션은, 실제 비서가 수행하는 일 중 일부를 대신할 수 있어 업무 효율을 높일 수 있는 플랫폼이다. 그 대상이 특정돼 있지 않은 불특정 다수에 대해서도 지능적이고 능동적으로 대처할 수 있는 능력이 지능형 앱의 특징이다. 이는 업무의 구조가 바뀔 가능성을 내재하고 있으며, 종국에는 인간을 대체할 수 있는 수준까지 성장할 가능성도 함께 가지고 있다. 스마트폰의 음성 비서 서비스가 현재진행형인 대표적 지능형 애플리케이션의 일종이다.

가트너 부사장 데이빗 설리는 “10년 안에 대부분의 앱과 서비스는 일정한 수준의 인공지능을 탑재하게 될 것”이라며, “이런 현상은 앱과 서비스를 위한 인공지능과 머신 러닝의 적용 범위를 발전·확장해 나가는 장기적인 트렌드를 형성하게 될 것”이라고 언급했다.
 

오늘 새로 온다는 비서는 누구죠? 아, 지금 제가 들고 있다고요?

디지털 비서, 어떻게 ‘생각’하나요?
지능형 앱을 가장 가까운 미래에 적용되는 걸 상상하면, 역시 수많은 IT 기업들이 개발에 박차를 가하고 있는 인공지능 비서 서비스가 떠오른다. 현재 구현돼 있는 것은 마이크로소프트의 ‘코타나’, 애플의 ‘시리’, 아마존의 ‘알렉사’, 구글의 ‘구글 어시스턴트’ 등으로, 거대기업 위주로 실제 가상비서 서비스가 운영되고 있다. 노래 인식 앱 ‘사운드하운드’를 비롯한 스타트업 역시 음성비서 서비스 개발에 박차를 가하고 있다.

대부분의 사람들이 스마트폰을 사용하는 지금, 실생활에서 사용할 수 있으면서 인공지능과 결합했을 때 가장 큰 효과를 발휘할 수 있는 것은 음성비서 서비스다. 이미 대부분의 모바일 하드웨어 및 소프트웨어 제조사들이 음성인식 서비스를 제공하고 있으며, 계속되는 성능 개선으로 사용자들이 모바일 기기를 더욱 편리하게 사용할 수 있는 환경이 되고 있다.

 

애플의 음성인식 서비스 ‘시리’의 경우, 처음 출시됐을 때는 사용자 음성을 인식하지 못하는 경우도 많고 엉뚱한 답변을 내줄 때도 많았다. 그러나 업데이트가 지속되고 하드웨어의 성능이 좋아지며 음성인식으로 수행할 수 있는 서비스가 더 많아졌다. 비록 국내에선 아직 지원하지 않는 부분이 많아 100% 활용하지 못하고 있지만, 시간이 지나 제한이 풀리면 더 똑똑해진 스마트폰을 사용할 수 있을 것으로 기대된다.

물리적으로 형상화되는 것까지는 더 많은 시간과 연구가 필요하겠지만, 스마트폰이나 태블릿PC의 성능과 클라우드 서비스를 이용해 누구나 인공지능 비서 서비스를 이용할 수 있는 것은 그리 먼 미래의 일이 아니다. 잠시 가까운 미래를 상상해 보자. 개인 모바일 비서를 사용하는 기자의 하루는 지금과 비교했을 때 어떻게 달라질지 상상해 보자.

음성비서, 관건은 ‘인식’의 범위
지금까지는 ‘인공지능’이라고 명명되는 대부분의 서비스의 활용 범위가 제한적이었다. 기계 학습의 개념이 약해 사용자 데이터베이스가 누적돼도 이를 기반으로 오차를 줄이는 것은 최근에 와서야 이뤄졌다. 아직도 학습의 개념을 도입한 애플리케이션은 거의 없는 수준이지만, 거대한 데이터 기반의 머신 러닝이 적용되는 애플리케이션은 느리지만 조금씩 증가할 것이다. 종국에는 음성인식 서비스가 하나의 기기 내에 운용되는 모든 앱을 통합·관리할 수 있는 컨트롤 센터 역할을 하게 될 것이다.

이것이 가능해지기 위해 선행돼야 하는 영역이 ‘음성을 어떻게 인식하는가’의 문제다. SF 영화나 드라마에서 다양한 형태로 등장했던 음성인식 기술을 보면, 현재의 스마트폰처럼 사용자의 음성을 인식시키기 위해 홈 버튼을 누르는 등의 작업이 선행되지 않는다. 지금도 일부 스마트폰 음성인식 서비스에서 가능하긴 하다. 

이것은 애플의 ‘시리’가 2015년 iOS 9 업데이트에서 일부 구현한 부분으로, 이전까지는 전원을 연결한 상태에서만 작동했지만 지금은 해당 기능을 켜 놓으면 언제든 ‘시리야’라고 부르면 음성비서가 연결된다. 확실히 이전보다 사용하기 편해지긴 했고 활용 범위도 넓어졌지만, 아직도 평소에 이 서비스를 적극 활용하는 사람은 아이폰 사용자의 10%가 채 못 된다.

드라마 ‘전격 Z 작전’, 영화 ‘아이언 맨’의 인공지능 비서는 사용자가 어떤 상황에서 부르던 자신(AI)을 부른다는 것을 정확히 인식하고 반응한다. 음성비서 서비스가 제대로 된 인공지능이라 불리기 위해선 이런 호출이 상시적으로 이뤄져야 한다. 음성인식 기술의 연구는 1970년대부터 ‘은닉 마르코프 모델’(Hidden Markov Model, 이하 HMM)이 응용·연구되기 시작했고, 현재까지 많은 음성인식 기술에서 활용되고 있다. HMM은 확률 모델을 이용한 통계적 패턴을 인식하는 방법을 사용해, 구조가 유연하고 확장성이 넓어 지금까지도 많이 사용되는 음성인식 기술이다. 하지만 훈련과정 자체에서 수많은 훈련용 데이터베이스가 필요한 것이 단점이다.

지능형 애플리케이션에서 음성인식 서비스가 상대적으로 빨리 주목받고 있는 이유는 간단하다. 사용자가 기기를 컨트롤할 수 있는 가장 쉽고 빠른 방법이 ‘말하는’ 것이기 때문이다. 하지만 그와 동시에 사람의 말은 언어의 차이를 비롯해 말의 높낮이, 속도 등 정확한 인식을 위해 감안해야 할 점이 엄청나게 많다. “2016년 국내 GDP 성장률 검색해줘”와 “작년 울 나라 GDP 얼매나 컸나 좀 보여도”처럼, 같은 한국말이라 해도 의미만 같고 표현이 완전히 다른 경우도 감안해야 한다. 최근에는 기업 차원에서 수많은 사용자들의 음성 데이터베이스를 수집·저장할 수 있는 플랫폼을 소유·운영하는 경우가 많아 HMM의 단점을 상쇄할 수 있다. 

또한, 뇌신경과학과 컴퓨터공학의 합작인 ‘인공신경망’(Artificial neural network) 기술이 HMM과 접목돼 그 발전 속도가 점점 빨라지고 있다. 지금의 발전 속도가 유지된다면, 음성인식 기술의 시장 규모가 시장조사 업체 ‘Markets & Markets’의 추측처럼 2022년 약 120억 달러(한화 약 13조 4760억 원)에 이를 수 있다. 최근 삼성전자가 AI 플랫폼 개발 기업(비브랩스)을 인수한 것도 이런 시장 전망을 낙관적으로 봤기 때문일 것이다.

엔비디아는 최근 임베디드 시스템에서 인공지능 컴퓨팅을 구현할 수 있는 플랫폼 ‘젯슨 TX2’를 공개했다. 7.5W도 안 되는 전력 소모만으로도 고고도의 신경망을 구동할 수 있고, 플랫폼의 크기도 신용카드만큼 작아 거의 대부분의 가전제품에 인식할 수 있을 만큼 활용 범위가 대단히 넓다. 접근이 가장 빠르기도, 한편으로는 가장 어렵기도 한 음성인식 기술이 SF 영화와 같은 수준으로 발전한다면, 실생활에서 가장 먼저 ‘버튼’이 사라지게 될지도 모른다. 굳이 팔을 들어 손가락으로 스위치를 누를 필요 없이, ‘E 비서, 전기세 네가 낼래?’란 핀잔으로 집안의 조명을 끌 수 있게 될 테니 말이다.

 

오라클, 차세대 클라우드 지능형 앱으로 간다

출처: 오라클

오라클의 데이터 클라우드는 4만 5000여 개의 속성을 가진 50억 개 이상의 소비자와 기업 프로파일로 구성돼 있다. 오라클이 지난 3월 10일 차세대 서비스형 소프트웨어(SaaS) 클라우드 서비스를 출시했는데, 업무를 간소화하는 지능형 클라우드 애플리케이션을 개발할 수 있는 서비스로, 일종의 마더 머신이다.

지난해 9월, 오라클은 자사의 클라우드 애플리케이션 공급 서비스를 기반으로 서비스형 애플리케이션 클라우드 서비스를 공개했다. 이는 외부의 데이터에 실시간 분석과 행동 데이터를 결합해 조정·학습하는 클라우드 앱을 개발하기 위함이다. ‘어댑티브 인텔리전트 애플리케이션’(Adaptive Intelligent Application, 이하 AIA)으로 불리는 오라클의 차세대 클라우드는 50억 개 이상의 소비자와 기업 프로필 4만 5000여 개의 속성을 포함한 데이터 클라우드의 통찰력에 기반을 두고 있다.

차세대 클라우드가 활성화되면, AIA가 오라클의 웹 스케일 데이터를 활용하고 고급 데이터 과학을 적용해 사용자 및 행동 데이터를 학습·처리하고, 이렇게 도출된 타깃별 정보를 고객과 직원들에게 제공한다. 심층 분석을 통해 도출된 정보들은 조직 전반의 비즈니스 결과를 향상시키는 것을 도울 수 있는 지식 기반을 형성한다.

오라클의 애플리케이션 개발 담당 총괄 부사장 스티브 미란다(Steve Miranda)는 “오라클의 AIA는 거대한 데이터 클라우드에서 가져온 정보를 활용해 기존의 클라우드 애플리케이션 기능을 최적화한다. 이를 회사 내의 고유 데이터와 결합하면, 맞춤형 통찰력을 제공받아 사업의 성과를 향상시키도록 지원할 수 있다”고 자신했다.

 

인공지능 음성비서 서비스 전쟁

애플 '시리'
마이크로소프트 '코타나'
아마존 '알렉사'를 사용할 수 있는 블루투스 스피커 '에코'
구글 '어시스턴트'

현재 인공지능 음성비서 서비스를 개발·제공하고 있는 업체들은 모두 PC, 모바일 플랫폼을 갖고 있다. 애플의 ‘시리’로 불붙기 시작한 음성인식 서비스는, 머신 러닝의 개념이 더해지며 인공지능 요소가 조금씩 접목되고 있다. 마이크로소프트의 ‘코타나’, 구글의 ‘구글 어시스턴트’, 아마존의 ‘알렉사’, 삼성의 ‘S보이스’ 등이 음성으로 원하는 정보를 얻을 수 있는 음성비서 서비스들이다.

애플의 시리, 구글의 어시스턴트, MS의 코타나 등 모바일 기기와 PC에 기본 설치돼 사용할 수 있는 서비스가 있고, 아마존의 알렉사는 블루투스 스피커 ‘에코’를 구입해야 사용할 수 있다. 별도의 기기가 필요한 것은 구글의 ‘구글 홈’도 마찬가지다. 이들 기기는 평균 가격대가 100달러가 넘지만, 아마존 에코는 지금까지 거치형, 휴대형, 소형 등의 기기들이 300만 대 넘게 팔리며 큰 인기를 끌고 있다.

음성비서 서비스는 아직 사용자가 인공지능이라고 인정할 정도의 수준까지 도달하진 못했다. 일반적으로 시간과 날씨 정보를 알려주거나 모바일 웹브라우저에서 원하는 정보를 검색해 주는 정도이고, SF 영화에서나 볼 법한 인공지능과의 대화는 어렵다. 다만 이 정도의 기능이 컴퓨팅 디바이스에서 벗어나 일반적인 가전제품으로 확대돼 사물인터넷과 결합하면 그 용도가 무궁무진해진다.

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지