인공지능으로 구현하는 증강현실 사진 기술

[테크월드=선연수 기자] 

 

 

스마트폰 시대가 도래하면서, 누구나 멋진 사진을 스마트폰 하나로 담아낼 수 있는 1인 1카메라 문화가 자리 잡았다. 더 좋은 화질, 시야각을 넘어서 피부를 깔끔하게 보정해주는 기술, 다양한 분위기 필터에 이어 얼굴에 여러 가지 독특한 효과가 적용되기까지! 이와 같은 서비스는 초반엔 별다른 효과를 얻지 못했거나, 얼굴의 이목구비에 잘 들어맞지 않는 경우가 많았다. 그러나 최근엔 내 이목구비에 맞춰 가상으로 화장을 해주거나, 아예 어린 시절의 모습으로 얼굴을 바꿔주는 기술까지 등장했다. 어떻게 이렇게 자연스러운 효과를 적용할 수 있는 것일까?

 

찍기만 해, AI가 알려줄게

 

스마트폰의 AI 카메라 기능으로 AI가 촬영 화면의 피사체를 감지하는 모습   출처: LG전자

 

스마트폰의 AI 촬영 기능은 기존의 초점, 조도 조절 기능을 넘어, 주변 환경과 촬영 대상에 따라 어울리는 색상 필터를 입히거나 아웃포커싱을 지원하는 등 최적화된 모습으로 피사체를 담아낸다. 예를 들어 태양빛이 강렬한 야외에서 셀카를 촬영하면 밝기를 낮춰 얼굴이 잘 보이도록 조절하고, 실내에서 탁자 위에 올려진 책을 찍을 땐 초점과 수평을 조정해 균형 잡힌 구도에서 책이 강조되도록 촬영한다. 삼성은 이전에 출시한 갤럭시 S9에 인물, 꽃, 실내, 동물, 풍경, 푸른 식물, 나무, 하늘 산, 해변, 일출과 일몰, 물가, 거리, 밤, 폭포, 눈, 새, 역광, 텍스트 총 20가지의 인식 환경과 대상을 설정해 AI가 이를 감지해 최적화된 촬영을 할 수 있도록 설정했으며, 최근 갤럭시 S10에서는 SNS 활동을 겨냥해 강아지, 음료, 신발 옷 등 10개의 카테고리를 더 추가했다. 강아지를 촬영하는 경우 털의 세밀함이 더욱 살아나도록 하고, 음식은 색감을 더 강조해주는 등의 효과를 적용하는 방식이다.

 

구글렌즈로 글자를 번역하고 사물을 인지하는 모습   출처: 구글렌즈

 

구글은 단순히 대상을 분류하는 것뿐만 아니라 구체적으로 제품명이 무엇인지, 건물의 이름이 무엇인지, 작품의 이름과 작가명, 식물의 품종 등 다양한 정보를 분석해낸다. 특히, 사진 속 글자는 구글 번역이 제공하는 언어 번역 기능을 활용해 해석하며, 이와 같은 기능들은 한글로도 모두 이용할 수 있다. 구글은 이와 같은 기능은 식물 재배 과정에서 질병을 감지하는 기술에도 사용됐다. 나이지리아 플랜트 빌리지(Plant Village)팀의 아만다 람차란(Amanda Ramcharan) 박사는 구글의 텐서플로(TensorFlow)를 활용해, 작물 카사바(Cassava)의 이미지 5000여 개를 분석해 촬영만으로 식물의 질병 상태를 확인할 수 있는 누루(NuRu) 앱을 개발하기도 했다.

 

카메라 필터 효과로 즐기는 AR

카메라로 얼굴을 촬영할 때 눈을 키워주고, 인중에 수염을 달아주고, 머리에 모자를 씌워주는 필터는 순간의 즐거움을 선사하지만, 단순한 기술로 나타나는 효과는 아니다. 촬영하는 사람의 얼굴 윤곽을 파악하고, 이목구비와 얼굴 구조를 구별해내 정확한 위치에 효과를 실행시켜야 하는데 이를 AI가 해내고 있다. AI는 촬영하는 화면을 픽셀 단위로 분석해, 픽셀별 밝기와 조합에 따라 대상이 사람인지 물체인지 구별하고, 이목구비 위치까지 세세하게 분별해내는 것이다. 예를 들어 광대뼈 부분은 밝고, 코 주변은 어둡고, 콧대는 밝으며, 상대적으로 패인 눈 부분은 어두운 점을 감지해 ‘사람의 얼굴’로 인식해낸다. 그만큼 너무 어두운 환경이나 피사체가 빠르게 움직이는 경우엔 AI가 제대로 감지하지 못하기도 한다.

 

스냅챗의 아기 필터를 영화 어벤져스 캐릭터에 적용한 모습 출처: majormarvelking 트위터

 

사람이 수동으로 조절하거나 배경 효과만 제공하는 고정적인 효과가 아니라, 카메라가 담아내는 화면을 AI가 분석해 사용자에게 알맞은 효과를 가상으로 덧씌워주는 것으로, 이런 필터 효과는 증강현실(AR)의 일례로 볼 수 있다. AR이란 현실이 아닌 가상의 공간에 구성되는 가상현실(VR)과 달리, 현실에 가상의 이미지를 적용시키는 기술이다. 최근 스냅챗은 얼굴에 부분적으로 꾸밈 효과를 주는 것이 아니라, ‘아기 필터(Baby filter)’를 제공해 사용자의 얼굴 전체를 자연스럽게 어린 모습으로 바꿔주는 효과를 공개했다.

 

반복 학습으로 더욱 정확해지는 AI

 

 

AI는 어떻게 사진의 픽셀을 분별해 사람, 동물, 밝기, 수평 등을 감지해낼까? AI는 알고리즘을 활용해 데이터를 분석하고 이 과정에서 학습을 하면서 상황에 대해 결정을 하게 되고, 이것이 바로 머신러닝(Machine Learning) 기술이다. 머신 러닝을 위한 알고리즘에도 의사 결정 트리 학습, 귀납 논리 프로그래밍, 클러스터링, 강화 학습 등이 있으나 이는 개발자가 상황에 맞춰 최적화된 알고리즘을 계속적으로 개발해야 한다는 한계점이 있다. 즉, 조금이라도 물체가 가려지거나 초점이 흐리면 알고리즘이 대상을 분별, 인지하지 못하게 된다.

그러나 사람의 뇌 연결 구조를 본 뜬 인공 신경망(Artificial neural network) 알고리즘은 사람처럼 반복적인 학습을 통해 대상을 인지해내고 데이터를 분석해낸다. 이를 바탕으로 발전한 딥러닝은 데이터를 구축해나가며, 학습을 시작하는 초기 단계에는 결과값이 부정확할 확률이 높다. 이때 빅데이터를 활용한 수많은 연산을 통해 이미지의 경우엔 날씨, 밝기, 장애물에 상관없이 이미지를 정확하게 인지해낼 수 있게 된다.

 

가상과 현실의 경계를 넘나드는 AI

 

 

AI는 이제 현실, 가상 어느 한 쪽 영역에만 국한되는 기술이 아니다. 우리는 보다 사실적인 풍경을 담아내기 위해 AI 카메라 기능을 활용할 수 있고, 어린 시절 얼굴로 돌아가기 위해 AI 필터를 적용할 수도 있다. AI를 활용한 더욱 정밀한 작업, AR 환경 구축은 사진 보정 분야뿐만 아니라 포켓몬고와 같은 게임, 복잡한 기계 조작을 필요로 하는 산업 현장, 사방을 감지해 자동차 스스로 운전하는 자율주행 등 다양한 분야에서 활용될 수 있다. 미래에는 AI가 현실을 직시하고, 사람들은 AI가 만들어 낸 가상의 이미지가 뒤섞인 세상을 ‘현실’로 받아들이는 아이러니한 세상이 올 수도 있지 않을까?

 

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지
이 기사와 관련된 기사