데이터와 인공지능에 의한 초(超) 개인화 시대
상태바
데이터와 인공지능에 의한 초(超) 개인화 시대
  • 이건한 기자
  • 승인 2020.01.17 09:31
  • 댓글 0
이 기사를 공유합니다

초개인화 시대의 전망과 우리가 알아야 할 것들

[테크월드=이건한 기자] ‘당신을 위한 추천’, ‘XX님이 좋아할 만한’·· 요즘 어떤 온라인 서비스에서든 이와 비슷한 문구를 쉽게 볼 수 있다. 오직 나를 위해 엄선된 제품과 콘텐츠라는 문구. 왠지 조금이라도 더 눈길이 가는 것 같다. 실제로 꽤 괜찮은 추천을 받는 경우도 있다. 이를 ‘개인화’, 혹은 ‘맞춤형 서비스’라고 부른다. 처음엔 온라인 쇼핑 상품이나 포털의 뉴스 추천 등에 주로 적용됐지만, 요즘은 그 범위가 늘어 어느새 생각보다 많은 일상 영역에서 개인화 서비스를 경험할 수 있다.

기업과 소비자도 개인화를 점점 익숙하고 당연한 개념으로 받아들이는 추세다. 그만큼 앞으로의 제품·서비스 경쟁은 사용자에게 얼마나 더 가까이, 더 친숙하게 다가가 그에게 필요한 것을 예측해줄 수 있는지로 인해 희비가 갈릴 것이다. 2019년이 개인화 서비스의 성숙기였다면, 2020년은 진정한 초개인화 시대로 접어드는 원년이 될 것으로 보인다.

사진=게티이미지뱅크
사진=게티이미지뱅크

개인화를 이루는 기반 요소들

개인화 서비스는 크게 사용자 데이터와 인공지능(AI) 추론 알고리즘의 조합으로 만들어진다. 만약 여자친구의 손가락 사이즈를 모르면 그녀에게 꼭 맞는 반지를 선물할 수 없는 것처럼, AI가 개인의 취향과 필요에 걸맞은 맞춤형 서비스를 제공하려면 우선 그 사람에 대한 데이터 수집이 선행돼야 한다.

음악 스트리밍 서비스를 예로 들어보자. 그 사람이 자주 듣는 음악의 장르와 가수, 서비스 이용 시간, 음원에 내재된 메타 데이터 등이 개인화 서비스를 구현하기 위한 기본이다. 수집되는 데이터의 종류와 양이 증가하고, 잘 정제된 데이터일수록 알고리즘이 추론해낼 결과의 품질이 크게 좋아진다. 요즘 ICT 업계에서 ‘데이터가 경쟁력’이란 말이 괜히 바이블처럼 인용되는 게 아니다.

이런 데이터를 기반으로 개인화를 완성하는 AI 추론 알고리즘의 종류는 매우 다양하다. 하지만 아무리 똑똑한 AI라도 추천을 위한 최소한의 기준이 필요한 법이다. ‘협업 필터링(Collaborative Filtering, CF)’과 ‘콘텐츠 기반 필터링(Contents Based Filtering, CBF)’은 개인화 서비스 구현을 위한 대표적인 기반 알고리즘이다.

‘나’에 대한 관심이 부쩍 높아진 요즘 서비스들
‘나’에 대한 관심이 부쩍 높아진 요즘 서비스들

개인화 서비스는 크게 사용자 데이터와 인공지능(AI) 추론 알고리즘의 조합으로 만들어진다. 만약 여자친구의 손가락 사이즈를 모르면 그녀에게 꼭 맞는 반지를 선물할 수 없는 것처럼, AI가 개인의 취향과 필요에 걸맞은 맞춤형 서비스를 제공하려면 우선 그 사람에 대한 데이터 수집이 선행돼야 한다.

음악 스트리밍 서비스를 예로 들어보자. 그 사람이 자주 듣는 음악의 장르와 가수, 서비스 이용 시간, 음원에 내재된 메타 데이터 등이 개인화 서비스를 구현하기 위한 기본이다. 수집되는 데이터의 종류와 양이 증가하고, 잘 정제된 데이터일수록 알고리즘이 추론해낼 결과의 품질이 크게 좋아진다. 요즘 ICT 업계에서 ‘데이터가 경쟁력’이란 말이 괜히 바이블처럼 인용되는 게 아니다.

이런 데이터를 기반으로 개인화를 완성하는 AI 추론 알고리즘의 종류는 매우 다양하다. 하지만 아무리 똑똑한 AI라도 추천을 위한 최소한의 기준이 필요한 법이다. ‘협업 필터링(Collaborative Filtering, CF)’과 ‘콘텐츠 기반 필터링(Contents Based Filtering, CBF)’은 개인화 서비스 구현을 위한 대표적인 기반 알고리즘이다.

협업 필터링은 ‘당신과 비슷한 조건의 사람이 좋아하는 것이라면 당신도 좋아할 가능성이 높다’는 전제를 기본으로 한다. 성별과 연령, 위치 등의 정보를 기본으로, 비슷한 조건의 사람들이 공통으로 소비하는 콘텐츠 패턴을 근거로 상품을 추천하며, 가령 ‘20대 서울에 사는 남자가 즐겨 듣는 노래’가 CF의 예시라고 할 수 있다.

콘텐츠 기반 필터링은 콘텐츠에 내재된 메타 데이터를 분석해 그와 비슷한 콘텐츠를 추천하는 알고리즘이다. 넷플릭스 같은 영상 플랫폼의 추천 서비스는 기본적으로 사용자가 처음 고른 영화와 이후 감상한 영화에 담긴 태그(Tag) 같은 정보에서 공통점을 추출하고, 그것과 가장 유사한 영화를 추천해주는 방식을 기본으로 한다. 개미지옥처럼 느껴지는 유튜브의 연관 동영상 추천도 마찬가지다. 여기에 앞서 설명한 CF를 함께 적용하고, 다시 CB와 CF의 허점을 보완할 수 있는 여러 독자적인 알고리즘이 더해지면 비로소 하나의 개인화 기술이 만들어지는 것이다.

 

지금까지의 개인화, 앞으로의 초개인화

데이터와 추론 알고리즘의 조합으로 탄생한 개인화 기술은 사업자나 소비자에게나 대체로 이득이다. 사업자는 구매 가능성이 높은 사람에게 집중적인 판촉 행사나 광고를 집행함으로써 영업 효율을 극대화할 수 있고, 소비자는 자신에게 필요한 상품과 서비스 위주로 제안을 받으면서 보다 스마트한 소비가 가능해진다. 나와는 전혀 상관없는 스팸 광고를 조금이나마 피할 수 있다는 것도 장점이다. 또, 한번 개인화 서비스를 경험한 사람이 일방향 푸시 서비스로 돌아가기 힘든 이유이기도 하다.

2019년은 음악, 영상, 이커머스를 넘어 더욱 다양한 분야로 개인화 개념이 확산됐던 해였다. 비록 각각의 서비스 수준은 천차만별이었지만 사람들은 이제 더 이상 2% 아쉬운 기성복처럼 일률적인 서비스에 만족하지 못하고 있다. 이젠 어디든 자신에게 딱 맞는, 그러면서도 맞춤 양복처럼 비싼 가격을 지불할 필요가 없는 개인화 서비스가 도처에 널려 있기 때문이다.

맞춤옷에 익숙한 사람은 기성복이 불편하다.
맞춤옷에 익숙한 사람은 기성복이 불편하다.

이처럼 소비자의 눈높이는 갈수록 높아지고, 개인화 서비스를 제공하는 기업들 간의 경쟁도 그만큼 치열해지고 있다. 살아남기 위해서는 경쟁자보다 더 친절하고 높은 수준의 맞춤 서비스로 진화할 필요가 생겼다. 지금까지의 비동기적인 개인화를 넘어, 24시간 실시간으로 우리를 마크하는 초개인화 서비스로 말이다.

 

수동에서 능동으로, 실시간으로 진화하는 개인화

초개인화의 주요 특징 중 하나는 실시간성이다. 다시 음악을 예로 들어 내가 앱을 실행하거나 요청했을 때만 음악을 추천해주던 것이 기존의 개인화라면, 초개인화 시대의 음악 서비스는 평소 내 사용 시간에 맞춰 알아서 앱 실행을 제안하고 자주 쓰는 서비스로 한 번에 이동할 수 있는 인터페이스를 제공할 것이다. 혹은 내가 찾아보지 않아도 내가 좋아하는 가수와 관련된 실시간 이슈를 푸시로 알려준다거나 시간대별로 다른 플레이리스트를 제안할 수도 있을 것이다.

나아가 계절과 날씨, 사용자의 최근 기기 사용 기록 등을 바탕으로 심리 상태를 유추해 그에 걸맞은 음악을 추천하는 등, 더 이상 ‘나와 비슷한 사람들을 위한 추천’이 아니라 오직 ‘나를 분석한’ 맞춤형 추천이 이뤄지는 것이 개인화를 넘어선 초개인화 시대의 방향성이다.

초개인화는 ‘남과 같은 나’가 아닌 ‘나’ 그 자체에 주목한다
초개인화는 ‘남과 같은 나’가 아닌 ‘나’ 그 자체에 주목한다

금융·보험·투자 서비스처럼 전문적인 지식과 꼼꼼한 자료 데이터가 필요했던 영역에서도 초개인화가 확산될 것으로 전망된다. 개인의 운전습관에 따라 보험료를 감면해주는 식의 맞춤형 보험은 보다 정교해지고, 재테크 정보 제안, 신용등급평가를 위한 기반 정보들이 더욱 세분화될 것이며, 신한카드의 초개인화 서비스처럼 일 단위 시간별, 장소별 실시간 혜택을 제공하는 식의 서비스도 증가할 것으로 예상된다. 또한 기업의 초개인화 서비스 개발 수요에 맞춰 데이터 수집/분석 툴을 제공하는 기업들도 늘어나게 된다. 스켈터랩스의 ‘AIQ.AWARE’같은 초개인화 마케팅 솔루션이 그 예다.

 

초개인화 시대, 데이터는 양날의 검

한편, 초개인화 시대에는 이전부터 지적된 과도한 개인정보 수집과 활용 사이 ‘적정선’에 대한 논란도 한층 심화될 것이다. 데이터는 개인화 서비스의 근간을 이루는 뼈대다. 양질의 데이터를 꾸준히 공급받을 수 있는 기업은 그렇지 못한 기업과 비교해 매우 앞선 경쟁 우위를 점할 수 있다. 구글이나 애플, 페이스북처럼 플랫폼 서비스를 통해 매일 수억 명의 사용자들이 만들어 내는 데이터를 스펀지처럼 흡수하는 이들이 정점의 위치에서 쉽사리 내려오지 않는 이유다.

하지만 이들도 지금보다 더 높은 수준의 개인화 서비스를 구현하려면 보다 세밀하고 많은 정보를 우리에게서 수집해야 한다. 그 과정에서 사용자에게 고지하지 않은 불법적인 수집과 프라이버시 침해가 일어날 가능성은 늘 함께한다.

실제로도 지난 수년간 그릇된 방법으로 사용자 데이터를 욕심냈던 많은 기업은 그 사실이 드러나 곤욕을 치르기도 했다. 무엇보다 이렇게 수집된 정교한 개인정보가 유출되는 경우 가장 막대한 피해를 입는 것은 바로 사용자들이다. 이들이 수집하는 개인정보 중에는 절대 바꿀 수 없는 것도, 세상에 드러나선 안 되는 것들도 포함된다.

기업과 정부의 몫, 사용자의 몫

특히 개인정보 침해에 대해 기업을 상대로 개인이 책임을 묻는 것은 현실적으로 어렵기 때문에 강력한 데이터 보호 법령은 초개인화 시대를 맞아 반드시 필요하다고 볼 수 있다. 이에 유럽연합(EU)은 2018년 5월부터 ‘GDPR’로 명명된 강력한 개인정보보호 법령을 시행하고 있다. 기업의 책임 강화와 정보주체의 권리 강화를 골자로, 이를 어긴 기업에 강력한 과징금을 부과하는 GDPR 같은 법은 무차별적인 데이터 수집에 경각심을 부여할 수 있다는 점에서 긍정적이다.

반면에 너무 과도한 데이터 규제가 오히려 기술의 진보를 막는다는 지적도 있다. 고도의 개인화를 구현하려면 반드시 그만큼 정교한 데이터가 수집돼야 하고, 이를 합법적으로 사용할 수 있는 근거가 마련돼야 한다. 결국 데이터를 악용하지 않는다는 전제하에 기업에도 수집한 데이터를 보다 부담 없이 활용할 수 있는 법적인 활로 역시 필요하다.

최근 어렵사리 통과된 ‘데이터 3법’ 중, 익명·비식별 처리된 개인정보를 기업이 자유롭게 활용할 수 있도록 한 개인정보보호법 개정이 그 예다. 피할 수 없는 초개인화의 시류 속에서 정부와 기업이 풀어야 할 숙제는 국민에게 돌아갈 혜택은 키우면서 동시에 기업이 투명하고 합리적으로 데이터를 활용할 수 있는 기반을 공고히 하는 것이다.

초개인화 시대를 맞이하는 개인의 몫은 자신이 누리는 편리함의 대가로 지불하는 데이터에 대한 주인 의식을 제고하는 것이다. 또 어떤 데이터가 수집되고 어떻게 쓰이는지 지속적인 점검과 감시를 이어가야 한다. 아울러 일방적인 추천 서비스에 길들여지며 편향적 시선에 갇히게 되는 필터버블(Filter Bubble) 같은 부작용도 초개인화 시대엔 더욱 강화될 것이므로, 이에 대한 경계의 자세도 지속할 필요가 있다. 사실 이 모두 익숙하고 당연한 이야기이지만, 익숙함에 빠져 잃지 말아야 할 것을 잃는 우는 범하지 말아야 할 것이다.

 

이 글은 테크월드가 발행하는 월간<EMBEDDED> 2020년 1월호에 게재된 기사입니다.


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.