시각 지능, 콘텐츠 비주얼 검색 분야 핵심 원천 기술 확보

[테크월드=이나리 기자] ETRI(한국전자통신연구원)는 27일, 미국 하와이 컨벤션센터에서 개최된 국제영상인식대회(ILSVRC, 이미지넷) 사물검출 분야에서 기술력을 입증하는 성적을 거뒀다. ETRI는 대학 연합팀들과 겨루어 사물 종류별 검출 성능 기준 2위, 평균 검출 정확도 기준 3위 성적을 달성했다고 밝혔다. 

ETRI가 참가한 사물 검출 분야는 200가지 사물(6만5500장) 사진 중 사물의 종류와 위치를 찾아내어 성능을 평가한다. 성적은 사물 종류별 검출 성능과 평균 검출 정확도(mAP)로 측정한다. 

‘이미지넷 대회’는 전 세계 인공지능 기술 경연의 장으로 영상 데이터 내  특정 사물을 정확하게 검색하는 기술 평가 대회다. 그 동안 구글, 마이크로소프트, 페이스북 등 세계적인 기관들이 참여, 기술을 경쟁해 왔다.

ETRI는 ‘딥뷰’팀과 ‘콘텐츠 비주얼 브라우징’팀이 참가, 딥러닝 기술 기반으로 사물의 종류와 위치를 검색하는 네트워크를 설계, 학습해 검출 성능과 정확도를 높이는데 주력했다.

그 결과 사물 종류별 검출성능 기준으로 ETRI‘딥뷰’팀이 2위를 달성했다. ‘딥뷰’팀은 10가지 사물에 대해 최고 성능을 보였다. 사물 종류별 검출 성능이 높다는 것은 특정 사물에 대해 차별화된 기술력을 가지고 있다는 것을 의미한다.

사물 검출 분야

본 대회에는 전체 14개 기관이 참가, 10가지 이상의 사물 종류에 대해 최고 성능을 기록한 팀은 2개 팀에 불과했다. 지난해에는 21개팀이 참가, 3개팀이 위와 같은 성적을 기록했다.

ETRI‘콘텐츠 비주얼 브라우징’팀은 KAIST 신진우 교수팀과 함께 평균 검출 정확도(mAP) 기준 0.61로 3위를 달성했다. mAP는 200가지 전체 사물의 검출 정확도를 나타내는 지표로 사물 검출 분야 종합 수준을 나타낸다. 전체 14개 참가기관 중 3개 팀만이 정확도 0.60 이상의 성적을 거뒀다. 

연구팀은 지난해 본 대회의 사물분류(Classification), 영상 내 사물위치 검출(Localization) 분야에 참가한 바 있으며, 영상 내 사물 위치 검출 분야에서 에러율 9.92%, 사물 분류 분야에서 에러율 3.25%로 5위를 달성한 바 있다.

한편, 지난 7월 21일 연구진은 현장에서 별도로 개최된 국제 저전력 영상인식 대회(LPIRC)에서도 ‘콘텐츠 비주얼 브라우징’팀이 2위를 차지했다. 국제전기전자기술자협회(IEEE)‘리부팅 컴퓨팅’분야에서 개최한 본 대회는 검출 정확도(mAP)와 검출 시 전력 소모량(Power)를 측정해 경쟁하는 대회다.

이번 이미지넷 대회에 참가한 ETRI ‘딥뷰’팀의 시각 지능 플랫폼 기술은 영상에 나타나는 다양한 사물과 행동을 이해하는 기술이다. 과학기술정보통신부가 지원하는 인공지능 국가전략프로젝트의 일환으로 개발 중에 있다. 연구진은 본 기술을 CCTV 영상분석, 광고 분석 등 공공 서비스 개발에 주력하고 있다. 

ETRI ‘콘텐츠비주얼브라우징’팀의 콘텐츠 비주얼 브라우징 기술은 영상을 통해 콘텐츠의 정보를 검색 하는 기술로 과학기술정보통신부가 지원하는 디지털콘텐츠원천기술개발 사업의 일환으로 개발 중이며 향후 건물 검색, 음식 검색 등 지능형 콘텐츠 검색 서비스에 적용할 예정이다.

과학기술정보통신부 김영문 디지털콘텐츠과장은 “콘텐츠 비주얼 검색 기술은 글로벌 콘텐츠 기업의 핵심 전략 기술로 이번 대회를 통해 글로벌 경쟁력 확보, 가상현실, 증강현실과 함께 4차 산업혁명을 주도할 수 있는 지능형 콘텐츠 분야의 교두보를 마련했다”고 밝혔다.

이 기사를 공유합니다
Tag

키워드

#ETRI #
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지