합성곱 신경망(CNN)

[테크월드뉴스=이혜진 기자] IT 분야엔 업계 관계자도 모르는 용어가 수두룩하다. 전문 분야에서 사용하는 독특한 어휘를 알면 기술의 트렌드를 이해하기 더 쉬울 것이다. 이달부터 IT 용어를 간단한 사례와 함께 비전공자도 읽기 쉬운 일상 언어 위주로 소개한다. [편집자 주]

2017년 네이버는 야한 사진과 영상을 걸러내는 기술인 ‘엑스아이(X-eye)’를 개발했다. 기술엔 ‘합성곱신경망(CNN∙Convolutional Neural Network)’이라는 인공지능(AI) 기법을 적용했다. 

CNN은 컴퓨터가 직접 사진과 영상, 글자와 소리를 분류하는 인공 신경망을 말한다. 인공 신경망은 사람의 신경망을 모방해 만든다. 여러 인공 신경망을 기기에 생성해 이를 바탕으로 학습 능력을 부여하는 기술은 ‘딥러닝’이라고 한다. AI의 핵심적인 기술이다. 

그래도 ‘합성곱’이라는 단어는 여전히 어렵다. 짧게 설명하면 컴퓨터는 이미지를 숫자로 인식하는데, 입력된 이미지를 빨강·초록·파랑(RGB) 유형으로 나눈 후 특정 필터 함수로 원본 이미지를 훑으며 곱해서 낸 최종값을 합성곱이라 부른다. 

CNN의 기본 원리를 설명하면 다음과 같다. 서울의 크고 작은 거리에 배치된 카메라의 영상에서 100명의 중요한 범죄 용의자를 발견하려고 한다고 치자. 그 첫걸음은 여러 용의자의 기존 사진들로 기기를 훈련시키는 것부터 시작해야 한다. 

훈련의 첫 단계는 이 같은 사진에서 오관의 특징을 추출하는 것이다. 오관은 사진에서 작은 부분을 차지한다. 이목구비를 찾는 작은 커널, 전문 용어로는 앞서 언급한 단어인 ‘필터’라고 한다. 

이 작은 필터를 사용해 왼쪽에서 오른쪽으로, 위에서 아래로 처리하려는 이미지를 스캔하며 눈을 발견할 수 있는지 본다. 그리고 또 다른 필터는 코의 발견을 책임진다. 

‘코를 발견한다’는 것은 무슨 뜻일까. 바로 코를 발견하는 필터가 코와 비슷한 도안으로, 이 도안이 코가 있는 부분을 스캔할 때 중합도가 가장 커진다. 

그렇다면 특징을 추출한다는 것은 무슨 뜻일까. 처음에 코 도안은 임의 도안이었고 무작위였다. 스캔을 한 번 하고 나서 일치되는 부분을 전혀 발견하지 못했다면 도안을 바꾼다. 마지막으로 용의자의 코와 매우 닮게 됐을 때 일치율은 가장 높게 된다. 코, 눈, 입 등의 필터 도안이 용의자와 맞아 떨어지게 되면 훈련은 성공한 것이다. 나중에 사진 1장을 입력하면 기기는 순식간에 어떤 이미지가 범죄 용의자를 나타내는지 아닌지 알려줄 수 있다.

머신러닝(기계학습)에서 기기는 스스로 특징을 찾아낸다. 처음에 기기는 어떤 특징을 찾아내야 할지 속수무책인 상태다. 필터는 코나 눈을 찾아야 한다는 사실도 알지 못한다. 처음 시작할 때 무작위의 모양에서 결국 이목구비의 형태로 바뀔 수 있을까? 이목구비가 얼굴에서 가장 중요한 특징이라면 이 필터는 마지막에 반드시 이목구비의 모습으로 바뀐다. 

신기하게도 기기는 인간이 알아채지 못하는 인간 얼굴의 주요 특징을 발견할 수 있다. 필터를 하나 추가해 6개가 되면 이 중 5개는 각각의 기관에 대응하고 하나는 미간이나 인중의 길이 등 새로운 특징을 찾을 수 있다. 찾은 특징이 많을수록 식별은 정확해진다. 

그럼 이제 합성곱에 대해 더 정확히 설명할 수 있다. 앞서 설명한 필터가 이미지를 상하좌우로 스캔해 일치율을 발견하는 과정이 바로 합성곱이다. 

앞서 설명한 야한 이미지, 범죄자 분류 외에도 <AI 트렌드와 투자 인사이트>에 따르면 CNN은 X-레이에 많이 활용된다. 흉부 사진에서 초기 폐암을 발견하려면 이미 확진받은 초기 폐암 환자의 사진을 갖고 기기를 훈련시켜야 한다. 이렇게 훈련된 기기는 폐암을 빠르게 발견할 수 있다. 

X-레이, CT 등 의료 영상 기기가 대중화된 데 비해 경험 있는 판독 의사는 매우 부족해졌다. 특히 소도시나 지방에는 경험이 풍부한 의사가 드물다. 만약 판독기가 서울이나 경기도의 대형병원에 있는 권위있는 의사 수준에 근접하거나 능가하면 의료 서비스의 발전을 기대할 수 있다. 

다만 주가 예측이나 자연어 이해 등 일부 중요한 문제는 CNN이 해결할 수 없다. 다음 시간에는 이런 문제를 해결할 수 있는 순환 신경망(RNN∙Recurrent Neural Network)에 대해 설명한다. 
 

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지
이 기사와 관련된 기사