AI 라벨링으로 한국판 뉴딜의 교두보 역할할 것

[테크월드=배유미 기자] 정부가 한국판 뉴딜 정책을 발표한 지 어언 3개월. 정부와 기관은 기술 업체와 손잡고 한국판 뉴딜 청사진을 그려 나가고 있다. 그 속도는 4차 산업혁명 시대와 포스트 코로나 시대가 맞물려 가속화되고 있다.

2018년에 설립된 인공지능 데이터 플랫폼 제공업체 슈퍼브에이아이도 이 사업에 적극적으로 참가하고 있다. 슈퍼브에이아이는 데이터 라벨링 플랫폼 스위트를 개발했다. 한국과 미국에 지사를 두고 있는 슈퍼브에이아이는 데이터 라벨링을 통해 기술 개발과 일자리 창출, 두 마리 토끼를 동시에 잡겠다는 방침이다.

김현수 슈퍼브에이아이 대표

김현수 슈퍼브에이아이 대표는 미국 듀크대학교에서 전자공학과 생명공학을 전공하고, 인공지능 박사과정을 거쳤다. 이후 SKT 연구조직에서 2년 정도 근무했고, 그간 쌓은 경험을 토대로 슈퍼브에이아이를 설립했다. 김현수 대표를 만나 데이터 라벨링과 한국판 뉴딜사업 로드맵에 대해 들어봤다. 다음은 김현수 대표와의 일문일답이다.

 

Q. 이전에 한글 OCR 인공지능 학습용 데이터를 배포해 화제가 됐다. 데이터셋을 구축한 계기가 있나.

인공지능 연구개발은 대부분 오픈소스 데이터셋을 토대로 진행된다. 하지만 연구자들이 스스로 생성하고 확보하기에는 비용이 만만치 않다. 이와 같은 이유로 개발자들 대부분 구글이나 페이스북 등에서 공개한 데이터를 토대로 연구를 진행하는 방식을 채택해 왔다. 하지만 이들은 영문 소스를 지원하기 때문에, 한글 소스가 턱없이 부족한 상황이었다.

때문에 한글 OCR 인공지능 학습용 데이터 780만 자를 공개했을 때, 슈퍼브에이아이가 주목을 받았다. 당시 NIA 한국정보화진흥원에서 데이터셋 구축 과제에 참여하고 있었는데, AI 데이터 산업 활성화를 위해 개발자가 사용할 수 있는 오픈소스를 만들어야 하겠다는 마음이 있었다. 데이터셋을 보유하고 있는 NIA 측에 따르면, 많은 기업이 우리의 데이터셋을 받아갔다.

한편, 우리는 현재 지도 제작, 보안, 국토 분석 등에 사용될 항공 위성 데이터셋도 구축하고 있다. 이는 특히 AR 산업 활성화를 위한 프로젝트 일환으로 진행될 예정이다.

 

Q. 슈퍼브에이아이는 데이터 라벨링 솔루션을 제공하는 업체다. 인공지능 개발에 있어 데이터 라벨링이 얼마나 중요한지, 그리고 스위트를 개발하게 된 계기가 무엇인지 설명해 달라.

먼저 생각해야 할 것은, 인공지능은 사람의 손이 필요하다. 인공지능은 학습된 범위 내에서만 데이터를 처리할 수 있다. 사고능력 밖에 있는 데이터는 여전히 사람이 개입해 주입하는 과정을 거쳐야 하는데, 이 주입하는 과정이 ‘데이터 라벨링’이다.

인공지능의 사고와 직결되는 만큼, 데이터 라벨링 과정은 중요하다. 일반적으로 인공지능을 개발하는 경우를 보면, 전체 개발 기간의 80%를 데이터 라벨링에 할애한다. 많은 시간이 소요되며, 효율적이지도 않다. 개발자들이 개발에만 집중해야 하는데, 데이터 라벨링에만 매달리게 되는 것이다.

이를 해결하기 위해 스위트를 출시했다. 이 솔루션을 사용하면 데이터 라벨링 시간을 최소 3배, 최대 10배까지 단축시킬 수 있다. 현재는 베타 버전이며, 정식 버전은 올해 하반기 내 출시할 계획이다.

슈퍼브에이아이의 스위트 시연화면

Q. 스위트 솔루션이 3~10배 정도 시간을 단축시킬 수 있다고 했다. 어떤 방법으로 단축시킬 수 있었나?

데이터 구축은 ▲라벨링 ▲검수 이 두 과정을 거쳐 진행된다. 스위트는 AI를 이용해 이 두 단계를 거쳐 기존에 비해 데이터 구축 시간을 최대 10배 단축시킬 수 있다.

먼저, 라벨링 속도 자체를 개선했다. 현재 라벨링에 적용되는 AI는 100가지 종류의 이미지, 비디오를 통해 사물을 라벨링한다. 정확도는 약 80~90% 정도다. 현재 지속해서 개발 중이며, 이후 3000개까지 라벨링할 수 있도록 그 양을 늘릴 계획이다.

두 번째로 효율적인 검수 과정을 통해 소요 시간을 단축시킨다. 검수 단계에는 AI가 데이터를 얼마나 잘 라벨링했는지 파악하는 과정을 거친다. 사람이 일일이 보고 사진에 있는 사물이 잘 명시됐는지 파악해야 하는데, 만만치 않게 오래 걸리는 작업이다.

이를 위해 스위트는 라벨링 상태를 명시해 추가 검수가 필요한 데이터만 확인할 수 있도록 한다. 먼저, AI가 사진 분석 난이도를 보여준다. 쉽게 분석할 수 있었던 사진은 초록색, 중간은 노란색, 어려운 것은 빨간색으로 표시한다. 또한, 라벨링한 대상도 명확한 것은 초록색, 검수가 필요한 것은 노란색으로 표시해 사람은 노란색 데이터를 집중적으로 검수하면 된다.

이 라벨링과 검수 단계를 모두 합치면 10배 정도 시간을 단축시킬 수 있다.

 

Q. 주로 스위트를 공급하는 곳은 어디인가.

스위트 플랫폼은 모든 파트너를 대상으로 솔루션을 제공하고 있다. 스위트가 하나의 플랫폼 역할을 하면서 머신러닝 업계 종사자들이 그 안에서 협업하도록 한다. 이 스위트 플랫폼에는 데이터를 수집하는 곳, 데이터에 라벨링하는 곳, 솔루션을 개발하는 곳, 서비스를 개발하는 곳 등 다양한 클라이언트가 들어올 것이다.

실제로 머신러닝 데이터는 앞서 언급한 업체의 손을 거쳐 가공된 후 사용된다. 보통 각 업체는 각자만의 툴을 사용해서 데이터를 가공하는데, 각 업체 간 전달 시 추가 변환을 해야 한다.

이와 같은 비효율성을 최소화하고자, 스위트는 개발자들이 데이터셋 호환 과정을 거치지 않고 바로 사용할 수 있도록 지원한다. 이를 통해 개발자는 본업에만 집중해 더 좋은 서비스를 소비자들에게 제공할 수 있다. 이와 더불어 스위트가 지원하는 기능을 토대로 통계 분석이나 시각화, 인공지능 기술 개발 등도 할 수 있다.

Q. 정부가 한국판 뉴딜정책을 시행하겠다고 발표했다. 슈퍼브에이아이도 동참하고 있는 것으로 알고 있는데, 어떻게 협업하고 있나?

우리가 직접 데이터 라벨링하는 인력을 채용하는 것은 아니다. 하지만 우리가 하고자 하는 것은 사용하기 쉬운 데이터 라벨링 솔루션을 다른 업체가 사용하고, 이들이 라벨링 인력을 고용해 일자리를 창출하는 선순환을 만들겠다는 것이다. 솔루션 제공과 함께 라벨링 사업에 뛰어들고 있는 회사, 기관에 사업 운영 노하우와 전문성도 이전하고자 한다.

그 일환으로 7월 1일 시니어 전문기업 에버영피플과 MOU를 체결했다. 실제로 해보면 시니어, 경력이 단절된 사람, 장애인 등도 조금만 숙지하면 배울 수 있을 정도로 진입장벽이 낮다. 때문에, 취약계층의 고용 문제를 해결할 수 있을 것으로 생각한다.

 

Q. 일각에서는 데이터 라벨링 사업에 대해 부정적인 시각을 가지고 있는 것으로 알고 있다. 이에 대해 어떻게 생각하는가.

단순반복 작업이라는 인식이 강해서, ‘인형 눈붙이기’라고 칭하는 것 같다. 사실 라벨링 작업 자체는 간단하기 때문에, 전문성이 없어도 누구나 할 수 있다. 때문에 경쟁력이 낮다고 생각하고, 이에 대해 비판하는 사람도 더러 있다.

하지만 라벨링 과정이 간단할 뿐, 라벨링이 필요한 데이터는 다양하다. 인공지능은 금융, 의료, 법률 등 전문직에도 접목된다. 의료 데이터는 의료계 종사자나 의대생이 할 수 있다. 법률 데이터 라벨링은 법조계 종사자가 할 수 있다. 다시 말해, 각 데이터를 파악하기 위해서는 관련 전문지식이 필요하다.

또한, 단순한 라벨링 업무라 하더라도, 누군가에게는 소중한 일자리가 될 수 있다. 특히, 사회적 취약계층은 진입장벽이 높은 직종에 바로 뛰어드는 것이 쉽지 않은데, 일자리를 제공한다는 것으로도 큰 의미를 가진다고 생각한다.

 

Q. 인공지능 글로벌 시장 현황은 어떠한가.

인공지능 학회에서 논문을 제출한 국가를 보면, 미국과 중국이 1, 2위를 다투고 있다. 몇몇 국가가 뒤를 잇고 있는데, 한국도 상위권에 속한다. 개인적으로 한국의 경우, 한국판 뉴딜정책이 선순환을 일으킬 수 있을 것이라고 기대한다. 이를 기반으로 데이터 사업이 활성화됐으면 한다.

글로벌 인공지능 시장에서 재밌는 점은, 기술회사는 북미에 다수 위치해 있고, 라벨링 사업은 주로 중앙아시아, 동남아시아, 아프리카 쪽에 밀집해 있다. 그만큼 북미를 비롯한 국가는 기술력에서 강점을 드러내고 있고, 아시아, 아프리카 등지는 인건비에서 강점을 드러내고 있다. 슈퍼브에이아이는 데이터 라벨링 기술을 개발하고 있는 한국 업체이다. 지리적으로도 사업 방향적으로도 중간에 위치해 교두보 역할을 할 수 있다. 따라서 양 측의 피드백을 듣고, 영업도 가능할 것이라고 생각한다.

Q. 마지막으로 슈퍼브에이아이의 목표와 인공지능 업계에 대한 제언을 부탁한다.

현재 더 많은 양의 데이터를 빠르고 정확하게 처리할 수 있는 기술을 개발하고 있다. 또한, 스위트를 곧 정식 론칭할 예정인데, 개발자, 머신러닝 사업의 발전과 함께 일자리 창출 등 사회적으로도 기여하고 싶다. 스위트 플랫폼 상에 있는 업체 간 커뮤니티를 활성화하고 싶은 마음도 크다. 결국 외부적으로나 대외적으로나 ‘좋은 회사’가 됐으면 좋겠다.

국가 차원에서는 한국에 인공지능 개발자들이 많아졌으면 좋겠다. 지금 인공지능 산업과 기술은 서비스에 접목될 수 있는 수준까지 올라왔다. 이에 정부 측에서 한국판 뉴딜사업도 추진하고 있어, 산업을 육성하기 좋은 시기다. 이와 함께, 관련 대학 학과를 비롯해 여러 교육과정이 개설되고 있는데, 최적의 조건이라고 생각한다.

여전히 기술 개발자 모수는 적다. 하지만 각 학교와 측에서도 인공지능 전문 교수를 초빙하고 있고, 여러 교육 커리큘럼을 진행하는 등 노력을 기울이고 있다. 또한, 인공지능 기술이 접근하지 못할 정도로 어려운 기술은 아니다. 교육과정을 충실하게 이수하기만 하면 이와 관련된 분야 커리어를 쌓을 수 있는 분야다. 그러니, 기술에 관심이 있는 사람이라면 인공지능 분야에도 관심을 가지면 좋겠다. 그렇게 더 많은 개발자가 나와 진정한 한국의 디지털 뉴딜을 이끌어 갔으면 한다.

이 기사를 공유합니다
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지
이 기사와 관련된 기사