네이버는 국제패턴인식협회인 ‘IAPR’이 시작한 국제 경진 대회인 ‘ICDAR Robust Reading Competition’을 통해 올해만 세 가지 과제에서 1위를 기록했다고 밝혔다.
ICDAR Robust Reading Competition은 디지털 이미지와 비디오 상에서 텍스트를 감지/인식하는 기술인 Robust Reading 분야에서 가장 권위있는 국제경진 대회다.
국제패턴인식협회인 IAPR이 시작했으며, ICDAR Robust Reading Competition 2017은 컴퓨터 비전 분야 비영리 연구 기관 CVC(Centre de Visio per Computador)가 조직하고 스페인의 과학혁신부가 서포터로 참여했다.
OCR(Optical Character Recognition)은 크게 이미지에서 ▲문자의 위치를 찾는 ‘검출 기술’과 ▲문자가 무엇인지 알아내는 ‘인식 기술’로 나뉜다.
2017년에 공개된 다국어 데이터를 기반으로 한 문자 영역 검출에 대한 과제 ‘Multi-Lingual scene Text(MLT) Localization’에서 네이버가 73.68%를 기록하며 1위를 차지했다.
해당 기술은 영어를 포함한 라틴 계열의 문자뿐만 아니라, 한국어, 일본어, 중국어, 아랍어, 뱅골어 , 특수 기호 등 총 7개의 문자 영역을 검출하는 기술로, 단일 언어를 검출하는 것 보다 훨씬 고도화된 기술력이 요구된다.
문자 종류 구분 기술은 다국어 문자 검출 기술과 연관된 기술로, 검출된 영역에 해당하는 총 7개의 문자 종류 중 하나의 문자 종류로 분류하는 기술이다.
한편, 지난 6월에는 2013년에 공개된 근접 촬영 데이터에 대한 문자 영역 검출 과제 ‘Focused Scene Text Localization’에서도 네이버의 문자 검출 기술이 타 글로벌 AI 기업 대비 가장 높은 점수인 94.02%를 기록한바 있다.
네이버는 OCR 기술을 파파고 등 실제 서비스에도 적용하며 AI 기술을 실제 사용자들이 쉽게 체감할 수 있도록 지원한다는 방침이다.