인공지능의 기대주로 떠오른 딥러닝

[테크월드=정동희 기자] 인공지능(Artificial Intelligence)이란 용어는 1956년 미국 다트머스의 한 학회에서 처음 등장했다. 당시 학회에서 존 매카시(John McCarthy)는 인공지능은 ‘기계가 인간 행동의 지식과 같이 행동하게 만드는 것’으로 최초 정의했다. 초기 인공지능 기술 연구는 컴퓨터가 주어진 문제를 해결할 수 있도록 직접 룰을 지정해주는 방식으로 진행됐다. 그러나 이내 복잡한 문제에 대해 설계의 어려움 때문에 발전이 정체됐다.

1970년 이후 인공지능 열기는 점차 시들해졌다. 전문가들 사이에 일명 AI의 겨울이라고 불리는 시기가 시작된것이다. 그러나 얼마 지나지 않아 봄은 찾아왔다. 컴퓨터 하드디스크의 용량이 기하급수적으로 늘어나고 1990년대 인터넷 시대가 열리면서 방대한 정보가 확보됐기 때문이다. 2010년대에 접어들면서 딥러닝, 신경망네트워크, GPU등의 등장으로 새로운 방법론, 고속의 연산 더욱 많은 데이터를 수집하고 처리할 수 있게 됨에 따라, 정확한 인식이 가능해지며 급속도로 인공지능은 산업에서 주목받기 시작했다.

인공지능은 어느새 인간의 문제에 대한 답을 추론해 내는 과정이 인간의 능력과 거의 비슷한 수준에 이르렀다. 우리에게도 인공지능이란 용어는 생소하지 않다. 인공지능과 관련된 영화나 콘텐츠들은 무수히 쏟아져 나왔었다. 최근 국내에서 인공지능이 이슈로 떠올랐던 것은 세기의 대결이라고 불렸던 ‘알파고’와 이세돌 9단과의 바둑 대결에서다.

세기의 대결에서는 ‘아직은 이르다’는 기존의 예상을 뒤엎고, 알파고가 이세돌 9단을 4:1 스코어로 승리했다. 이후 사람들의 반응은 엇갈렸다. 인간의 고유한 영역이라고 생각했던 바둑에서 알파고의 활약은 인간에게 어떤 분야에서도 인공지능이 인간을 뛰어넘을 수 있다는 기대감과 두려움을 동시에 가져다 줬다. 최근 주목받고 있는 머신러닝과 딥러닝도 인공지능의 한 분야라고 생각하면 쉽다. 

머신러닝과 딥러닝
머신러닝은 엄격하게 정해진 명령들을 수행하기보다 입력된 데이터를 기반으로 예측이나 결정을 이끌어내기 위한 알고리즘이다. 사람은 어떤 문제를 해결할 때 경험을 토대로 다음 문제를 이전보다 개선된 방법으로 해결한다. 한마디로 머신러닝은 이와 같은 인간의 문제 해결 방법을 컴퓨터에 적용한 것이다. 머신러닝은 세가지의 학습방법이 있다.

먼저 지도학습(Supervised learning)으로 불리는 방법으로 입력된 데이터에 대한 판단 결과가 명확히 주어진 경우에 사용하는 방법이다. 간단한 예로 아이들이 사물을 익혀 나가는 과정을 보면 된다. 먼저 아이들은 그림책을 먼저 보며 사물을 익힌다. 사물을 익히고 난 후 아이들은 실제 세상에서 그림책에서 본 사물들을 실제 사물에 대입한다. 이것이 지도학습이다.

두번째는 비지도학습 (Unsupervised Learning)이다. 비지도학습은 답을 매칭시키는 학습이 아니다. 간단히 말해 답이 없는 질문만 무수히 던져놓는 방식이다. 무수히 많은 질문들을 유사성에 따라 군집분류(Clustering)해 결과를 도출한다. 간단히 말해 지도학습에서 ‘빨갛고 둥그런 과일은 사과’라는 학습을 시켰을 때, 사용자가 ‘파란색 사과’라는 질문을 던지면 컴퓨터는 ‘사과’라는 답을 추출할 수 없다.

반면 비지도학습은 수많은 모양과 색깔의 사과를 무작위로 입력하면 컴퓨터는 데이터를 군집화해 군집에 속한 조건에 따라 색상이나 모양의 차이에 상관없이 사과라는 답을 추출해낸다. 즉 컴퓨터 스스로 데이터를 군집화하고 학습을 해나가는 것이다. 마지막으로 강화 학습 (Reinforcement Learning)이 있다. 강화학습이란 문제의 답이 명확하지 않은 상태에서 보상과 손실이 주어진다면 보상을 최대화 하는 방향으로 진행하도록 설계하는 방식이다. 데이터에 대한 답이 명확하지 않는다는 점에서 비지도학습과 유사하지만, 결과를 유추해 학습에 반영한다는 것이 기존의 학습방식과 다르다.

강화학습은 주로 게임이나 전략적 판단이 필요할 때 활용된다. 인간의 뇌는 다양한 감각 기관으로부터 입력된 데이터를 판단해 즉시 답을 출력한다. 수 많은 뉴런의 연결로 구성돼 있는 뇌의 구조를 ‘신경망'(Neural Network)이라고 한다. 상호 연결된 시냅스(Synapse)를 통해 신호를 주고 받으며 정보를 전달하게 된다. 뉴런에 임계치(Threshold) 이상의 신호가 입력되면, 그 뉴런은 활성화(Activation)되면서 시냅스를 통해 신호를 전달하고 임계치를 넘지 않은 경우 뉴런이 활성화 되지 않아 신호가 전달되지 못한다. 이 같은 뇌의 정보 전달 방식과 유사하게 신경망 구조를 여러 층으로 깊이(Deep)있게 구성해 학습하는 것이 바로 딥러닝이다.

(자료제공=마인즈랩)

 

예를 들면 기존 머신 러닝에서는 특정 동물을 구별을 하기위해서는 설계를 통해 동물들 간 차이점을 추출해 그 특징을 바탕으로 분류 학습을 진행했다. 하지만 딥러닝은 정보를 구분할 수 있는 최소한의 단위, 이미지의 경우 픽셀 데이터를 입력하면, 입력된 값과 출력된 결과물의 오차가 최소화 되는 방향으로 네트워크가 스스로 학습한다.

딥러닝중 잘 알려진 인공 신경망의 경우 역사는 1940년대까지 거슬러 올라 간다. 프랭크 로젠블라트(Frank Rosenblatt) 코넬대 교수는 입력신호를 연산해서 출력하는 퍼셉트론(Perceptron)이라는 개념을 1957년에 제시했다. 퍼셉트론은 비선형연산에 대해선 작동하지 않는 한계로 금방 잊혀졌지만, 1980년대 퍼셉트론을 다층구조(Multi-layer)로 연결하면, 비선형연산도 가능하다는 사실이 발견됐다.

당시에는 어쩔 수 없는 시대적 한계가 있었다. 첫째, 층을 깊이(Deep) 있게 쌓아야 인공지능의 성능이 개선되지만, 계산할 양이 증가하고 이는 당시 컴퓨터의 성능으로는 극복하기 힘든 한계였다. 둘째, 층이 깊어 진다는 것은 층간의 연결 변수들이 증가한다는 것을 의미하는데 이는 학습을 통해 찾아야 할 미지수가 늘어나는 것을 의미한다.

변수가 증가할 수록 입력 해야할 데이터가 많이 필요하다. 앞서 서두에서 밝힌 것처럼 이 문제는 2000년대에 들어 문제가 해결되기 시작했다. 데이터의 홍수로 오히려 데이터를 분별해야 하는 시대가 온 것이다. 더불어 컴퓨터 하드웨어의 성능 개선, GPU연산등의 방법이 등장하면서 연산속도가 비약적으로 발전됐다. 딥러닝(Deep Learning)의 ‘Deep’은 다양한 측면의 의미를 가지고 있다. 대부분의 인공지능 연구자들에게는 Deep은 인공신경망의 은닉층(Hidden Layer)이 2개층 이상인 경우를 의미하거나 심화학습을 뜻한다.

 

 

이 기사를 공유합니다
Tag

키워드

#인공지능 #딥러닝
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지