[생활TECH] 게임 스파이 꿰뚫어보는 AI
상태바
[생활TECH] 게임 스파이 꿰뚫어보는 AI
  • 선연수 기자
  • 승인 2019.11.28 13:00
  • 댓글 0
이 기사를 공유합니다

분석 레이더 장착한 AI 캐릭터, 피해갈 수 있을까?

[테크월드=선연수 기자] 동아리에서 친구들과 둘러 앉아 마피아 게임을 할 때, 게임을 하는 족족 마피아를 찾아내는 친구가 있다면, 혹은 절대 본인이 마피아임을 들키지 않는 친구가 있다면 어떨까? 마피아 게임이란 4~10명의 사람이 모여 사회자가 비밀리에 마피아, 시민, 의사, 경찰 등을 지명해 플레이어 간에 서로의 역할을 모르는 상황에서 마피아를 추론해내는 게임이다. 과연 인공지능도 이 게임에서 마피아를 알아낼 수 있을까?

 

사람을 상대로 단순한 계산부터 바둑, 게임 등 다양한 영역에서 인공지능(AI)의 무패 성공률은 높아져만 가고 있다. 지난 1월 구글의 딥마인드는 멀티 플레이어형 전략 게임인 스타크래프트2를 위한 AI ‘알파스타’로 프로게이머와의 대결에서 10:1로 승리했으며, 10월에는 상위 0.2%인 그랜드마스터 레벨 등급에 올랐다는 연구 결과가 네이처(Nature) 학술지에 실렸다. 이제는 이기고 지는 단순한 행동을 넘어, AI가 게임 속 스파이가 되거나 스파이를 알아낼 수 있다.

 

게임트리로 정체 알아내는 AI 스파이

메사추세츠 공과 대학(Massachusetts Institute of Technology, 이하 MIT)은 지난 19일 함께하는 플레이어의 아군, 적군 여부를 알 수 없는 상황에서 게임을 승리로 이끌어 내는 게임 로봇 ‘딥롤(DeepRole)’에 대해서 소개했다. 이 연구는 MIT 전기 공학·컴퓨터 과학 전공의 대학생 잭 세리노(Jack Serrino)와 하버드 대학교(Harvard University)와 MIT에서 CBMM(Center for Brains, Minds and Machines)과 뇌인지과학과에서 박사 후 과정 중인 클레이맨 웨이너(Kleiman-Weiner)가 함께 진행했다. 딥롤은 게임 ‘레지스탕스: 아발론(The Resistance: Avalon)’의 온라인 버전으로 사람들과의 4000번이 넘는 게임을 통해 데이터를 학습했다.

 

보드 게임 ‘아발론’

아발론은 랜덤으로 3명의 플레이어를 ‘저항(Resisitance)’ 팀에, 2명의 플레이어를 ‘스파이(Spy)’ 팀으로 나눈다. 스파이 역할을 맡은 2명은 팀원 전체의 역할을 알고 있다. 게임은 여러번의 미션을 수행하는 방식으로 진행되며, 5명이 함께 실행하는 게 아닌 2명 또는 3명이서 진행하게 된다. 플레이어 들은 먼저 미션을 진행할지 말지 결정한 뒤, 참여하는 플레이어들은 ‘성공’과 ‘실패’ 중 하나를 다른 플레이어 모르게 선택하게 된다. 이때 저항팀은 ‘성공’만 선택할 수 있다. 한 명이라도 ‘실패’를 선택한 경우 미션은 실패하게 된다. 미션을 3번 성공하면 저항 팀의 승리로, 미션 실패를 3번 해내면 스파이 팀이 승리하게 되는 방식이다.

클레이맨 웨이너는 “기존 실험들과는 달리 아군과 적군을 모르는 상태로 게임을 시작하기 때문에, 상대를 파악하는 연산 과정이 필요하다”고 설명한다. 이는 전제로부터 결론을 도출해내는 연역적 추론으로 강화된 CFR(Counterfactual Regret minimization)이라는 게임 알고리즘을 사용한다. CFR은 스스로를 상대로 게임을 반복학습한 알고리즘을 말한다. 게임 중 미션을 플레이할 때, CFR은 다른 플레이어의 잠재적인 행동을 선(Line)과 노드(Node)로 인식하고 ‘게임 트리(Game tree)’를 만든다. 따라서 이 게임트리는 플레이어가 취할 수 있는 모든 경우의 수를 가지게 되는 것이다. CFR은 수십억 번의 게임 시뮬레이션을 수행한 뒤, 경우의 수에 대한 승패 확률을 결정하고, 게임에서 승리하기 위해 전략을 계속해서 수정해나간다. CFR은 게임 내에서 일어나는 공개적인 행동과 개인적인 행동을 모두 결합해 플레이어의 스파이 여부를 결정한다.

 

게임트리 구조 모식도   출처:MIT

CFR에 기반한 봇, 딥롤은 게임을 시작할 때 게임 트리를 이용해 플레이어별로 역할을 추정하고, 확률을 할당한다. 만약, 봇이 플레이어 A를 저항팀이라고 추정했으나, A의 행동이 게임 트리 내 저항팀의 선택 확률과 다르게 흘러가고 있다면, 봇은 A를 스파이로 여기게 된다. 이를 통해 같이 미션을 수행하지 않은 플레이어의 반응도 분석해, 게임 성공 확률이 높아질 수 있는 결정을 내린다.

연구팀은 이번 연구에서 게임 내 캐릭터가 취하는 행동을 분석했지만, 실제 플레이어가 주고받는 채팅까지도 함께 분석하려는 시도 중에 있다. 또한, 이런 과정들은 실제로 처음 입사한 회사에서, 처음 들어간 학교에서 누가 ‘내 팀’인지를 알아내야 하는 일상 환경을 모방하고 있다고 설명한다. 이에 대한 연구 결과는 내달 12월 중 발표될 예정이다.

 

AI가 멀티플레이 장점 앗아갈까?

 

리니지2M

넷마블은 지난 3월 AI 게임 회사로 거듭날 것을 선언하며, 사용자의 게임 패턴, 능력 등을 분석해 최적화된 게임 콘텐츠를 제공하는 ‘넷마블 3.0’을 준비하고 있다. 앤씨소프트는 지난 27일에 출시된 ‘리니지2M’ 속 일부 몬스터 캐릭터들에 AI 패턴을 결합해, 플레이어의 표적을 파악하고 이에 맞춰 행동하는 새로운 경험을 선사할 예정이다. 이렇게 단순히 이기고 지기 위한 확률이 아닌, 사용자의 구체적인 행동을 하나하나 분석하는 AI가 등장하게 되면, 더 이상 여러 플레이어가 함께 참여하는 ‘멀티플레이’형 게임의 의미가 없어질지도 모른다. AI는 플레이어가 충분히 흥미롭게 게임을 즐길 수 있도록 이끌어주기 때문이다. 또한, AI가 사용자를 분석해낸다는 건 그 대상처럼 행동할 수 있다는 것을 의미하기 때문에, AI 캐릭터들과 마치 실제로 친구들과 함께 하는 듯한 팀전을 즐길 수도 있을 것이다.


관련기사