고려대, 한국어 특화 LLM ‘구름3’ 공개

AI 상담 챗봇, RAG 기반 질의응답시스템 등 활용 가능
고려대 NLP&AI 연구실-HIAI 연구소 협력하여 개발
  • 등록 2024-04-14 오전 9:02:08

    수정 2024-04-14 오전 9:02:08

[이데일리 김현아 기자]고려대 NLP&AI 연구실과 HIAI 연구소가 협력하여 개발한 한국어 특화 LLM인 ‘구름3(KULLM3)’가 공개됐다.

임희석 고려대 컴퓨터학과 교수가 이끄는 NLP&AI 연구실과 HIAI 연구소는 2023년 6월 ‘KULLM(구름)’을 처음 공개하며, 지금까지 실제 활용할 수 있는 수준으로 한국어 생성 능력을 향상하는 것을 목표로 했다.

이를 위해 고품질의 한국어 지시어(instruction) 데이터 셋을 제작하는 데 공을 들였고, 이를 활용해 한국어 지시를 따르는(instruction-following) 능력을 대폭 향상했다.

연구팀은 여러 가지 데스크에 관한 다양한 한국어 데이터 셋을 제작했으며, ‘구름3(KULLM3)’ 모델만을 위한 특수 데이터도 제작했다. 이러한 고품질의 데이터는 Upstage의 SOLAR-10.7B 모델에 적용되어 지시 튜닝(instruction-tuning) 학습을 통해 ‘구름3(KULLM3)’이 탄생했다.

임희석 고려대 컴퓨터학과 교수
다방면에서 우수한 성능을 보이는 ‘구름3(KULLM3)’
‘구름3’ 활용 예
‘구름3’ 활용 예


연구팀이 GPT-4-Turbo를 활용하여 분석한 결과 ‘구름3(KULLM3)’의 생성 답변은 기존의 한국어 모델보다 매우 우수했으며, GPT-3.5 Turbo와 GPT-4 Turbo에 준하는 능력을 보였다.

연구팀이 제시한 성능에 따르면 모델이 생성한 답변의 ‘유창성(Fluency)’, ‘응집성(Coherence)’, ‘정확도(Accuracy)’, ‘완결성(Completeness)’, ‘총점(Overall Quality)’ 평가에서 우수한 성능을 보였다.

연구팀은 ‘구름3(KULLM3)’ 모델이 한국어로 된 지시 사항을 이해하고 실행하는 능력이 뛰어남을 강조했고, 이를 활용해 AI 상담 챗봇과 RAG 기반 질의응답시스템 등 다양한 분야에서 활용할 것으로 기대했다.

임희석 고려대 컴퓨터학과 교수는 “요즘 한국어 private LLM과 설치형(On-premise) 방식의 LLM 구축에 관심이 많다”면서 “실질적인 한국어 생성 성능이 월등한 ‘구름3(KULLM3)’가 좋은 대안이 될 수 있을 것이라 기대한다.”라고 밝혔다.

고려대 NLP&AI 연구실과 HIAI 연구소는 매년 자연어처리 분야의 최우수 학술대회에서 국내 최고 수준의 논문을 발표하고, LLM을 이용한 일상의 AI를 위한 연구에 매진하는 등. 국내 인공지능 분야의 선도그룹이다.

이데일리
추천 뉴스by Taboola

당신을 위한
맞춤 뉴스by Dable

소셜 댓글

많이 본 뉴스

바이오 투자 길라잡이 팜이데일리

왼쪽 오른쪽

스무살의 설레임 스냅타임

왼쪽 오른쪽

재미에 지식을 더하다 영상+

왼쪽 오른쪽

두근두근 핫포토

  • 한라장사의 포효
  • 사실은 인형?
  • 사람? 다가가니
  • "폐 끼쳐 죄송"
왼쪽 오른쪽

04517 서울시 중구 통일로 92 케이지타워 18F, 19F 이데일리

대표전화 02-3772-0114 I 이메일 webmaster@edaily.co.krI 사업자번호 107-81-75795

등록번호 서울 아 00090 I 등록일자 2005.10.25 I 회장 곽재선 I 발행·편집인 이익원

ⓒ 이데일리. All rights reserved