마이크로소프트(MS)가 워드, 엑셀, 파워포인트 등 MS 오피스 제품에서 한국어로 AI 비서 기능을 제공하는 MS 365 코파일럿을 출시한 가운데, 한글 문서에서도 AI 기능을 사용할 수 있는 시대가 열리고 있다. 이는 워드보다는 한글문서(HWP)을 더 많이 사용하는 정부 부처나 공공기관이 오피스 프로그램에서 AI 비서 기능을 활용하는 데 도움이 될 것으로 예상된다.
|
정지환 한컴 최고기술책임자(CTO)는 지난 18일 열린 한국인공지능산업협회 조찬 모임에서 “AI와 전자문서 기술의 융합은 업무 혁신의 새로운 차원을 열 것”이라며 “우리는 개방형 포맷인 HWPX를 통해 한글 문서가 AI 학습용 데이터로 변환될 수 있음을 실증했고, 이를 기반으로 다양한 AI 솔루션을 개발 중에 있다”고 밝혔다.
혁신적인 AI솔루션 출시한 한컴...삼성SDS와 국회 사업 수주
한컴은 이를 기반으로 ‘한컴 데이터 로더’, ‘한컴 어시스턴트’, ‘한컴 피디아’ 등 혁신적인 솔루션을 출시했다. ‘한컴 데이터 로더’는 PDF 문서에서 텍스트를 추출하고 이를 AI가 학습하기 용이한 여러 포맷(JSON, CSV, TXT, XML 등)으로 변환할 수 있는 도구로, 데이터 처리의 효율성을 크게 향상시킨다. ‘한컴 어시스턴트’는 한글 문서와 연동된 대화창을 통해 보도자료 작성, 목차 및 표 생성, 연설 포인트 및 인사말 작성 등을 지원하는 기능을 제공한다. 또한, ‘한컴 피디아’는 고객이 보유한 문서를 바탕으로 질의응답을 지원하는 솔루션으로, 빠르고 정확한 정보 처리를 가능하게 한다.
이 솔루션들은 현재 97건의 개념검증(PoC) 프로젝트에서 활발히 활용되고 있으며, 특히 한컴은 삼성SDS와 함께 국회 빅데이터 플랫폼(AI국회) 구축 사업을 수주했다. 이 프로젝트는 ‘한컴 피디아’를 활용한 대규모 비정형 데이터 라벨링 자동화 작업을 통해 데이터 구축이 이루어진다. 또한, 국회의원실, 사무처, 도서관, 예산 정책처 등 다양한 기관들은 국회 빅데이터 플랫폼을 통해 문서 요약, 번역, 검색, 문서 작성 등 AI 비서 서비스를 이용할 수 있게 된다.
정지환 CTO는 “각 회사나 기관이 보유한 전자문서 데이터를 활용해 AI를 생성해야 정보의 신뢰성과 정확성을 높일 수 있다”며 “텍스트 추출을 넘어 메타 데이터를 추가로 추출하는 기술을 개발했으며, 이제 한글 문서에서 별도로 인터넷 창을 열지 않고도 제품 내에서 AI 기능을 활용할 수 있게 됐다”고 설명했다.
다만 한컴의 개방형 HWPX 형식에 근본적인 한계는 여전하다. 워드를 서비스하는 MS는 OXML을 국제 표준으로 채택했으며, 이는 웹 기반 응용 프로그램과의 호환성에서 큰 장점으로 작용한다. 한컴은 크롬 확장 기능을 통해 HWP 뷰어 실행을 가능하게 했지만, 여전히 웹에서의 직접적인 지원에는 제약이 따른다.