플리토, 국립국어원 말뭉치 사업 수주…38억 규모

이 기사 AI가 핵심만 딱!
애니메이션 이미지
한국어-외국어 병렬 말뭉치 595만 어절 구축…아랍어 신규 포함
동남아 저자원 언어 데이터 확보…AI 번역·음성 기술 고도화 기대
누적 구축 6100만 어절 전망…“데이터 주권·AI 경쟁력 강화 기여”
  • 등록 2026-04-13 오전 8:40:48

    수정 2026-04-13 오전 8:40:48

[이데일리 이소현 기자] 인공지능(AI) 데이터 및 솔루션 전문 기업 플리토(300080)는 국립국어원이 추진하는 ‘한국어-외국어 말뭉치 구축 사업’을 수주했다고 13일 밝혔다.

플리토, 38억 규모 국립국어원 ‘한국어-외국어 말뭉치 구축 사업’ 수주(사진=플리토)
이번 사업은 인공지능(AI) 시대에 한국어 기반 언어 데이터 확보와 통번역·음성인식 기술 개발을 지원하기 위한 국립국어원의 대표 사업이다. 총 사업 규모는 약 38억원이다.

플리토는 경희대학교 산학협력단과 함께 공동 수행사로 참여해 545만 어절의 텍스트와 50만 어절의 음성 데이터를 포함한 총 595만 어절 규모의 병렬 말뭉치 구축을 맡는다. 구축 대상 언어는 기존 9개 언어에 아랍어를 추가한 총 10개 언어다.

특히 올해는 문장 단위 중심에서 문단 단위로 말뭉치를 확장하고, 음성 기반 STS(Speech to Speech) 데이터도 함께 구축해 AI 번역 및 음성 인터페이스 성능 개선에 활용할 계획이다.

플리토는 데이터 정제 및 검수 체계 고도화, 평가 기준 및 도구 개발 등 품질 관리 작업도 병행한다. 이번 사업을 포함하면 플리토가 구축한 누적 말뭉치는 약 6100만 어절에 이를 전망이다.

구축된 데이터는 동남아시아 등 저자원 언어 데이터 부족 문제를 해소하고, 글로벌 AI 기술 격차 완화와 차세대 번역 모델 개발에 활용될 것으로 기대된다.

이정수 플리토 대표는 “언어 데이터 전문성과 품질을 인정받아 사업에 참여하게 됐다”며 “정부 및 연구기관과 협력해 고품질 AI 데이터 공급을 확대해 나가겠다”고 말했다.

이 기사 AI가 핵심만 딱!
애니메이션 이미지

이데일리
추천 뉴스by Taboola

당신을 위한
맞춤 뉴스by Dable

소셜 댓글

많이 본 뉴스

바이오 투자 길라잡이 팜이데일리

왼쪽 오른쪽

MICE 최신정보를 한눈에 TheBeLT

왼쪽 오른쪽

재미에 지식을 더하다 영상+

왼쪽 오른쪽

두근두근 핫포토

  • 女神들의 전쟁
  • '꺅 BTS 오빠!' 난리난 남미
  • 멧갈라 여신 블핑
  • 추위를 날려~
왼쪽 오른쪽

04517 서울시 중구 통일로 92 케이지타워 18F, 19F 이데일리

대표전화 02-3772-0114 I 이메일 webmaster@edaily.co.krI 사업자번호 107-81-75795

등록번호 서울 아 00090 I 등록일자 2005.10.25 I 회장 곽재선 I 발행·편집인 이익원 I 청소년보호책임자 임경진

ⓒ 이데일리. All rights reserved