‘GTC’ 통해 GPU 기반 딥 러닝 개발 열기 '후끈'

엔비디아가 올해 실리콘밸리를 시작으로 서울·베이징·타이페이·암스테르담·도쿄·멜버른·뭄바이 등 4개 대륙과 8개 도시에서 개최된 GPU 개발자 컨퍼런스인 GTC(GPU Technology Conference)를 개최했다. 이 자리에서는 미래 기술의 핵심 화두로 자리 잡고 있는 딥 러닝과 AI 기반 컴퓨팅이 그려갈 미래에 대한 논의와 교류가 이뤄졌다.

GTC는 GPU의 대규모 병렬 처리 성능을 활용한 새 접근 방식의 HPC(고성능 컴퓨팅) 기술 발전을 지원하기 위해 지난 2009년 시작됐다. 최근에는 인공지능(AI) 기술에 변화를 가져온 GPU 기반 딥 러닝의 중심지로 변모했다. 최근 2년 새 GPU 딥 러닝 개발자 수는 25배 급증했으며 1천500여 개의 AI 스타트업이 생겨나는 등 AI 분야의 성장이 전 세계 GTC 개최 수요로 이어진 것이다.

차세대 컴퓨팅

엔비디아 측은 올해 전세계에서 개최된 일련의 GTC를 통해 AI 컴퓨팅 기술을 이용하여 학습하고 생각하며 사람과 상호 작용하는 지능형 기계의 등장이 현실로 다가왔음을 확인했다고 밝혔다. 이미 AI가 탑재된 자율주행차가 등장해 시범 주행에 나서고 있으며 인공지능 로봇은 운동 능력을 익히고 있다.

AI 컴퓨팅은 산업과 사회 전반에 있어 거대한 변혁을 일으킬 것으로 전망된다. 컴퓨팅 기술이 진화하면서 다양한 기업들이 나타나고 새로운 제품이 제작돼 일상을 변화시키고 있는 형국이다. 컴퓨팅 기술의 역사를 돌이켜 봤을 때 이러한 물결은 항상 컴퓨팅의 능력과 범위 모두를 확장시키는 혁신적인 컴퓨팅 모델을 토대로 한다.

1995년 PC-인터넷 시대는 저가의 마이크로프로세서(CPU), 표준 운영체제(Windows 95), 정보의 세계로 가는 새로운 포털(Yahoo!)의 합작으로 시작됐다. PC-인터넷 시대가 오자 십억 명 이상의 사람들이 컴퓨터를 활용할 수 있게 됐다. 모든 책상과 가정에 컴퓨터를 보급한다는 마이크로소프트의 비전이 현실화된 것이다. 10년 후 아이폰이 등장하면서 인터넷 통신 기기는 주머니 속으로 들어오게 됐다. 아마존 웹서비스(AWS)를 전환점으로 본격적인 모바일-클라우드 시대도 도래했다. 애플리케이션이 일상으로 들어왔고 모바일 컴퓨팅이 주는 혜택을 현재 30억 명이 누리고 있다.

이 다음은 GPU 딥 러닝이라는 AI 컴퓨팅 시대라는 것은 어렵지 않게 짐작할 수 있다. 막대한 양의 데이터에서 패턴을 인식하도록 심층신경망을 훈련시키는 이 모델은 컴퓨터 과학에서 가장 복잡한 문제들을 효과적으로 해결해 보였다. 소프트웨어가 저절로 작성되고 기계가 알아서 학습한다. 수천억 대의 기기에 지능이 주입돼 결국 AI가 모든 산업에서 혁명을 일으킬 것으로 기대되고 있다.

GPU 딥 러닝의 폭발적 성장

지난 2012년 토론토 대학의 알렉스 크리제브스키는 예시 이미지 백만 개를 자동으로 인식하도록 학습한 심층신경망을 만들었다. 엔비디아 GTX 580 GPU 두 개로 며칠 동안 학습한 알렉스넷(AlexNet)은 수십 년 간 정상의 위치에 있던 인간 전문가의 알고리즘을 모두 제치고 그 해의 이미지넷(ImageNet) 대회에서 우승했다. 같은 해 신경망의 규모가 클수록 학습 능력도 향상된다는 것을 인식한 스탠포드 대학교의 앤드류 응(Andrew Ng) 박사와 엔비디아 연구 팀은 함께 협력하여 대규모 GPU 컴퓨팅 시스템으로 신경망을 훈련하는 방법을 개발했다.

이때부터 전 세계 AI 연구자들의 이목이 GPU 딥 러닝에 집중했다. 구글, 페이스북, 마이크로소프트, 바이두 등 세계 유수의 IT 기업들은 이 기술을 패턴 인식에 도입했다. 이제 컴퓨터의 이미지 인식은 인간의 능력을 상회한다. 마이크로소프트 리서치(Microsoft Research)는 음성 인식 영역에서 GPU 딥 러닝을 사용해 대화마저 인간의 수준에 도달했다.

이미지 인식과 음성 인식을 통해 GPU 딥 러닝은 기계가 스스로 학습할 수 있는 토대를 마련했다. GPU는 인간의 상상을 시뮬레이션하기 위한 엔진에서 출발해 비디오 게임과 공상과학 영화에서 가상의 세계를 연출했다. 그랬던 것이 엔비디아의 GPU는 딥 러닝 알고리즘을 실행하며 인간의 지능을 시뮬레이션하고 세계를 인식하고 이해할 수 있는 컴퓨터·로봇·자율주행차의 두뇌 역할을 담당한다. 인간의 상상력과 지능이 서로 연관되어 있는 것처럼 GPU에는 컴퓨터 그래픽과 인공 지능이 공존하는 것이다.

AI 컴퓨팅을 위한 엔드-투-엔드 플랫폼

새로운 컴퓨팅 모델로서의 GPU 딥 러닝은 소프트웨어의 개발과 실행 방식을 바꾸고 있다. 예전에는 소프트웨어 엔지니어가 프로그램을 만들고 세심하게 알고리즘을 제작했다면 이제는 실존하는 대량의 데이터를 학습하는 알고리즘을 통해 소프트웨어가 스스로를 완성한다. 프로그래밍은 코딩 지침에 불과하며 딥 러닝이 신경망을 만들고 훈련시키는 역할을 담당한다. 이러한 신경망을 데이터 센터에 배치할 경우 새로 제시되는 방대한 데이터를 추론과 예측·분류에 활용할 수 있다. 카메라, 자동차, 로봇 등과 같은 지능형 기기에 네트워크를 구축해 세계를 이해하게 하는 것이 가능해진 것이다.

새 경험이 생기면 새 데이터가 생겨난다. 이를 통해 신경망을 훈련시키고 보다 좋은 결과물을 만들어 내며 수십 억 대의 기기를 통해 학습한 결과는 네트워크에 연결된 모든 기기에 전송돼 그 인공지능은 더 정교해진다. 신경망은 GPU 처리와 대형 네트워크의 기하급수적인 발전에 힘입어 무어의 법칙보다 훨씬 빠른 속도로 지능을 쌓아갈 것으로 보인다.

과거 컴퓨팅 모델이 명령 처리를 중심으로 이뤄졌다면 새 모델은 대규모 데이터 처리에 초점이 맞춰져 있다. 엔비디아는 AI의 모든 면을 진보시키기 위한 엔드-투-엔드 AI 컴퓨팅 플랫폼 제작에 노력을 기울이고 있다.

엔비디아의 새로운 파스칼(Pascal) GPU는 20억 달러의 개발비와 수천 명의 엔지니어가 3년 동안 노력한 끝에 완성됐다. 이는 딥 러닝에 최적화된 최초의 GPU이기도 하다. 파스칼은 알렉스 크리제브스키가 논문에 사용했던 케플러(Kepler) GPU보다 65배 더 크고 빠르게 네트워크를 훈련시킬 수 있다. 파스칼 GPU 8개를 현존하는 가장 빠른 연결 기술인 NVLink로 연결한 컴퓨터 한 대는 기존 서버 250대보다 빠른 속도로 신경망을 훈련한다.

전 세계에서 매일 생성되는 방대한 양의 데이터를 AI를 통해 실시간 처리 및 대응하기 위해서는 클라우드 서비스에서 부담해야 할 작업 부하도 상당하다. 엔비디아는 최근 데이터 센터에서의 추론 속도를 높이기 위해 테슬라(Tesla) P40 및 P4 GPU를 발표했다. P40은 데이터 센터의 추론 처리를 40배 가속화하며, 소 비 전력이 50와트에 불과한 P4는 일반적인 하이퍼스케일 데이터 센터에 흔히 사용되는 1U OCP 서버를 가속화하도록 설계됐다.

엔비디아의 딥 러닝 플랫폼의 중추적인 역할은 소프트웨어가 맡고 있다. 훈련용 소프트웨어로는 쿠다(CUDA)와 cuDNN이 있으며 추론 소프트웨어로는 최적화 추론 엔진인 텐서RT(TensorRT)가 발표된 바 있다. 텐서RT는 레이어 내부와 레이어 간의 연산을 융합, 기여도가 낮은 부분을 제거하고 유효숫자를 FP16 또는 INT8로 줄여 기타 다양한 기술을 활용해 정확성 저하 없이도 성능을 개선한다.

언젠가 수십억 대의 지능형 기기에서 딥 러닝을 활용해 지능적인 작업을 수행할 것으로 예상된다. 드론들은 자율적으로 창고 안을 돌아다니며 물품을 찾아 가져오며 휴대용 의료 기기가 AI를 활용하여 현장에서 혈액 표본을 진단할 것이다. 지능형 카메라는 경고를 보내는 경우와 때를 익히게 될 것이다. 엔비디아는 이러한 지능형 IoT 기기를 위해 에너지 효율이 뛰어난 AI 슈퍼컴퓨터 젯슨(Jetson) TX1을 출시한 바 있다. 신용카드 크기의 모듈로 된 젯슨 TX1은 10와트의 전력만으로 1 테라플롭스(TeraFLOPS, FP16)의 성능을 갖고 있다. 엔비디아의 가장 강력한 GPU와 같은 아키텍처를 사용해 같은 소프트웨어를 모두 활용할 수 있다.

즉 엔비디아는 GPU에서 딥 러닝 소프트웨어와 알고리즘까지 훈련 시스템에서 차량 내 AI 컴퓨터까지 클라우드에서 데이터 센터와 PC와 로봇까지 아우르는 엔드-투-엔드 AI 컴퓨팅 플랫폼을 제공하고 있다.

모든 산업에 적용되는 AI 컴퓨팅=엔비디아의 엔드-투-엔드 플랫폼은 모든 산업에서 AI를 활용할 수 있게 만드는 첫 단계라 할 수 있다. 현재 엔비디아 GPU 딥 러닝 중심의 AI 생태계는 전세계적으로 확산되고 있다. 그 과정에서 혁신적인 결과가 속속 발표되며 검색·인식·추천·번역 등 소비자 인터넷 서비스에까지 AI를 도입하기 위한 경쟁이 촉발됐다. 알리바바·아마존·IBM·마이크로소프트 등 대표적인 클라우드 서비스 제공업체를 비롯한 크고 작은 기업들이 엔비디아 GPU 딥 러닝 플랫폼을 도입하고 있으며 세계 최대의 엔터프라이즈 기술 기업들은 엔비디아 GPU를 기반으로 서버를 구축 중이다.

인공지능 기반 교통 시스템

전 세계 10조 달러 규모의 교통 관련 산업은 AI가 변화시킬 수 있는 가장 거대한 산업 분야 중 하나라 할 수 있다. 자율주행 기술로 사고를 줄이고, 트럭과 택시 서비스의 생산성을 높이며, 새로운 이동 서비스를 개발할 수도 있다. 최근 바이두와 네덜란드 내비게이션 업체 톰톰(TomTom)이 자율주행 기술 개발에 엔비디아 드라이브 PX 2(DRIVE PX 2)를 도입한다고 발표한 바 있다. 엔비디아는 이들 기업과 HD 지도, AI 알고리즘, AI 슈퍼컴퓨터가 포함된 클라우드 기반 인공지능 자율주행차 플랫폼을 공동 개발하고 있다.

자율주행에는 주변 환경 및 일기 조건을 파악하고, 그에 따른 최상의 운행 계획을 수립하며, 나아가 지속적인 학습을 통해 복잡한 도로 상황을 포괄적으로 이해하는 것과 같은 고차원적인 인공지능 기술이 필요하다. 고속도로에서의 오토크루즈(Autocruise) 운행에서부터 목적지까지의 자율주행, 운전자가 없는 완전 자율형 셔틀까지 다양한 자율주행 기술에는 개방성과 함께 확장성을 갖춘 아키텍처가 필요하다.

PX2

엔비디아 드라이브 PX2는 자율주행 구현에 모든 영역의 AI 기능을 활용할 수 있는 확장성을 갖춘 아키텍처다. 엔비디아는 GTC를 통해 지속적인 현지화 및 지도 데이터 구축을 통해 고속도로에서 자율주행을 할 수 있도록 설계된 오토크루즈용 드라이브 PX 2(DRIVE PX 2 AutoCruise)를 발표했다. 감지·위치측정·계획동작을 포함한 자율주행의 모든 면을 다루는 자율주행 차량용 OS, 드라이브웍스 알파 1(DriveWorks Alpha 1)도 함께 출시했다.

엔비디아는 지능형·자율형 기계의 핵심이라 할 수 있는 시각 처리, AI, 고성능 컴퓨팅을 아우르는 혁신에 집중하고 있다. 엔비디아는 최초로 자율주행차와 자율형 로봇을 만들어 낸 AI 알고리즘을 보유하고 있으며 이를 위한 강력한 성능의 실시간 컴퓨팅 플랫폼 기술 또한 확보하고 있다.

엔비디아는 올해 GTC에서 세계 최초의 AI 슈퍼컴퓨터 칩 자비에(Xavier)를 선보였다. 자비에 는 가장 발달한 서버급 CPU를 능가하는 70억 개에 달하는 트랜지스터 집적수를 자랑한다. 자비에는 드라이브 PX 2와 동급인 초당 20조 회의 딥 러닝 연산 성능을 20와트의 전력만으로 제공하는 것이 특징이다.

AI 엔터프라이즈 기술=2조 달러 규모의 인지 컴퓨팅 부문에서 새로운 기회를 노리고 있는 IBM은 엔터프라이즈 부문에 AI 기술을 도입하기 위해 설계된 새로운 파워(POWER) 8 프로세서와 엔비디아 테슬라(Tesla) P100 기반의 서버를 발표했다. 소프트웨어 분야의 경우 SAP는 엔비디아 DGX-1 슈퍼컴퓨터 두 대를 최초 활용해 190개국 32만 명의 고객을 위한 머신 러닝 엔터프라이즈 솔루션을 적극 개발 중이라 발표한 바 있다.

AI 도시 안전망 시스템=감시 시스템 분야의 세계적인 리더 하이크비젼(Hikvision)은 AI를 사용해 도시 안전망을 강화하고 있다. 이 기업은 신경망 훈련에 엔비디아 DGX-1을 사용하며 젯슨 TX1 프로세서 16개를 기반으로 블레이드(Blade)라 불리는 서버를 구축했다. 블레이드는 동급 성능의 CPU 21개 기반 서버에 비해 1/20 수준의 공간과 1/10 수준의 전력만을 사용한다.

AI 공장 자동화 시스템=엔비디아는 올해 GTC에서 일본의 산업용 로봇 기업인 화낙(FANUC)이 엔비디아 AI 플랫폼을 기반으로 공장 자둥화 시스템을 구축할 것이라 발표했다. 심층신경망은 엔비디아 GPU로 훈련하고, GPU를 이용한 화낙의 포그(Fog) 컴퓨팅을 기반으로 로봇 여러 대를 구동하며 함께 학습하도록 하고, 각 로봇에는 실시간 AI로 작동할 GPU를 장착할 예정이다.

AI 기반의 4차 산업혁명=GPU 딥 러닝은 의료, 핀테크, 자동차, 소비자 웹 애플리케이션 등의 분야에서 세계적으로 1천500개 이상의 AI 스타트업 기업이 탄생하는데 일조했다. 최근 캘리포니아 주의 도로에서 테스트를 허가 받은 ‘Drive.ai’는 운전의 모든 영역에 딥 러닝을 적용해 자율 주행 기술의 문제점을 보완하고 있다. 일본의 채이너(Chainer) 프레임워크 개발사인 프리퍼드 네트웍스(Preferred Networks)는 IoT용 딥 러닝 솔루션을 개발하는 중이다. 런던의 Benevolent.ai는 DGX-1를 최초로 도입한 기업 중 하나이며 질병을 치료하기 위해 딥 러닝을 활용한 약품 개발에 매진하고 있다.

모두를 위한 AI

AI는 몇 년 전까지만 해도 불가능하다고 생각했던 문제들을 해결할 수 있는 잠재력을 가지고 있다. 컴퓨터가 실제 데이터를 바탕으로 사람이 제작한 소프트웨어나 사람의 힘으로는 너무 복잡하거나 거대하다고 여겨지던 패턴들을 학습하고 인식할 수 있게 된 것이다. GPU 딥 러닝은 이 컴퓨팅 모델을 실용화하고 세계 최대 규모의 산업들이 직면한 난제 해결을 위해 적용하는데 크게 공헌했다.

자율주행 차량은 10조 달러 규모의 교통 관련 산업의 지형을 완전히 뒤바꿀 것이며 의료 분야에서도 의사들이 AI를 활용해 조기에 질병을 발견하고 인간 유전자를 이해해 암을 치료하며 대량의 의학 데이터를 연구해 최적의 치료법을 추천할 수 있게 됐다. AI가 증기·대량 생산·자동화에 이어 4차 산업 혁명을 이루게 될 경우 지능형 로봇이 생산성 향상에 혁신을 가져오며 본격적인 대규모 소비자 주문 제작 시대를 불러올 것이다.

다시 말해 모든 산업과 일상에 혁명적인 변화를 가져올 AI의 시대의 도래는 이미 현실로 다가오고 있다.

이 기사를 공유합니다
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지