LG CNS, AI 학습용 표준데이터 10만 개 무료 공개
상태바
LG CNS, AI 학습용 표준데이터 10만 개 무료 공개
  • 김경한 기자
  • 승인 2019.09.05 15:33
  • 댓글 0
이 기사를 공유합니다

장문형 답변, 표나 리스트 형태 읽고 답변하기 기능 추가

[테크월드=김경한 기자] LG CNS가 AI의 자연어 이해를 위한 한국어 표준데이터 10만여 개를 제작해 국내 AI 업계에 무료로 개방한다.

LG CNS는 9월 5일 서울 강서구 마곡 LG사이언스파크에 국내 AI 전문가 300여 명을 초청해 AI 커뮤니티 행사 ‘AI Tech Talk(테크톡) for NLU’을 열어 ‘코쿼드 2.0’ 출시를 발표했다.

‘코쿼드 2.0’은LG CNS가 2018년 12월 공개한 ‘코쿼드 1.0’ 대비 한국어 표준데이터를 7만 개에서 10만 개로 확대하고 단답형에서 장문형 답변을 할 수 있는 AI를 개발할 수 있도록 데이터를 강화한 버전이다.
 
또한 코쿼드 2.0은 AI가 표나 리스트 형태에 담긴 정보도 읽어 답변할 수 있게끔 표준데이터 범위도 확대했다.
 
‘AI Tech Talk(테크톡) for NLU’ 행사에는 한국전자통신연구원(ETRI), 서울대, 카이스트 등에서 연구진과 교수진이 연사로 참석해 언어 AI 연구 성과와 최신 기술 트렌드를 공유했다. LG CNS의 코쿼드를 활용해 개발한 AI 모델의 성능평가를 받고 리더보드에 등재된 50여개팀 중 현재 1위를 기록 중인 네이버 클로바AI팀이 참석해 AI 개발 제작기를 발표했다.
 
LG CNS CTO(최고기술책임자) 현신균 부사장은 “응용분야가 무궁무진한 AI 언어 개발 분야에서 내부적으로 쌓은 데이터를 AI 업계 전체에 개방해 국내 AI 연구자들 간 상생을 위한 AI 개방형 생태계 조성에 기여코자 한다”고 말했다.

한편, LG CNS는 2018년 12월 위키백과 정보를 기반으로 AI 학습용 한국어 표준데이터 7만 개가 탑재된 코쿼드 1.0을 공개했다. 이후 AI 전문가들이 모인 오픈 커뮤니티 ‘텐서플로우 코리아’에서는 표준데이터 공개에 대한 폭발적인 반응을 얻었다. 또한 네이버, 카카오 등 국내 유수 AI 기술 기업들과 AI 현업 종사자 등 50여 팀이 코쿼드를 사용한 AI 개발에 나섰다.


관련기사