비전 분야에서 총 4편의 논문 발표..비전, 음성합성 분야서 3관왕

네이버가 컴퓨터 비전 및 딥러닝 분야 글로벌 최고 수준의 컨퍼런스 'CVPR 2019'의 비전과 음성합성 분야 워크숍 챌린지에서 마이크로소프트와 구글 등을 제치고 1위를 차지하는 성과를 거뒀다. 

CVPR은 세계 최대 기술 전문 단체인 IEEE와 CVF가 1983년부터 공동 주최하는 컨퍼런스다. 세계적인 연구기관들이 참석해 매년 새로운 컴퓨터 비전, 딥러닝 등 인공지능 기술 연구에 대해 공유한다. 올해 CVPR 2019은 지난 16일부터 20일까지(현지 시간) 미국 캘리포니아 롱비치에서 열렸다.

특히 네이버 클로바팀과 네이버랩스는 글로벌 기업들이 참여해 서로 기술을 겨루는 챌린지에서도 3관왕에 성공했다고 21일 밝혔다.

장기간 이미지 기반 측위(Long-Term Visual Localization) 챌린지의 지역 특장점부문 에서 네이버랩스 유럽은 구글 및 MS와 같은 기술 기업들을 큰 차이로 제치고 높은 점수로 1위를 수상했다.

챌린지는 특정 랜드마크의 주간 촬영 이미지와 촬영 위치를 기반으로 야간 촬영 이미지의 현재 위치를 찾아내는 것이다. 네이버랩스 유럽 연구진들은 딥러닝 기반의 고성능 신기술을 통해 해당 분야에서 15년간 활용되던 SIFT(이미지의 크기와 회전에 불변하는 특징을 추출하는 알고리즘)를 능가하는 결과를 도출해 냈다.

이 밖에 구글과 아마존이 스폰서로 참여한 'iFood 2019' 챌린지에서는 클로바 비전(홍기호·이정규·원태륜)팀이, 딥마인드와 구글 등이 스폰서로 참여한 ‘ActivityNet’ 챌린지에서는 클로바 스피치(정준선·이봉진)팀이 각각 1위를 차지했다.

네이버랩스 석상옥 대표는 "CVPR은 네이버랩스와 네이버랩스 유럽의 컴퓨터 비전 및 딥러닝 연구진들이 세계 최고 수준임을 다시 알릴 수 있는 좋은 기회였다"라며 "향후 일상 공간의 고정밀 데이터들을 네이버 서비스와 연결해 새로운 경험과 정보를 제공할 수 있는 요소 기술들이 될 것"이라고 말했다. 

한편 네이버는 정규 세션에서 인공지능 영역 중 '비전' 분야 논문 4편을 발표했다. 인공지능 비전 기술은 ▲번역 ▲이미지 분류 ▲자율주행 ▲동영상 서비스 등 여러 방면에서 활용되고 있다.

클로바 AI 연구원들의 논문 '텍스트 감지를 위한 문자 영역 이해'는 문자의 영역을 글자 존재 확률과 글자 간 동일 단어 확률을 예측해 문자인식(OCR) 성능을 높이는 기술을 담았다. 실제 이 기술은 현재 네이버 서비스에도 반영돼 있다.  

네이버랩스 연구원들이 발표한 '맵 업데이트를 위해 관심 분야 변화를 감지하는 능동 학습 방법'에 담긴 기술은 1년간 네이버랩스 한국과 유럽 연구진의 공동 연구를 통해 개발했다. 자율주행 로봇이 수집한 대규모 실내 공간 데이터를 분석한 후 바뀐 상호를 인식해 지도 정보를 최신으로 업데이트 하는 기술로 로보틱스, 컴퓨터 비전, 딥 러닝 등 네이버랩스의 핵심 기반 기술이 뒷받침됐다.

클로바AI 김성훈 리더는 "그 동안의 꾸준한 기술 연구 투자가 OCR, 음성 인식, 음식 이미지 분류 등 다양한 챌린지에서의 성과로 이어지며, 네이버 AI 기술 수준이 세계 최고 수준으로 성장했다는 것을 확인했다"며 "빠른 시일 내에 서비스에 적용해 서비스 고도화에 기여하고, 이를 통해 이용자들에게 많은 가치를 제공하게 될 것"이라고 밝혔다.

한편 네이버는 3년 연속으로 플래티넘 스폰서로 학회에 참여하며 글로벌 AI 인재 유치에 적극 나섰다.

저작권자 © 타이쿤포스트 무단전재 및 재배포 금지