|
|
알리바바 클라우드가 자사 개발 거대언어모델(LLM) ‘통이치엔원(Tongyi Qianwen)’의 720억 개 파라미터(매개변수) 버전 ‘큐원-72B(Qwen-72B)’와 18억 개 파라미터 버전 ‘큐원-1.8B(Qwen-1.8B)’를 오픈소스로 공개했다.
720억 개라는 매개변수는 네이버 ‘하이퍼클로바X’의 이전 버전(하이퍼클로바)의 2년 전(2021년 11월 기준)숫자(2040억개)보다 적고, KT의 ‘믿음(Mi:dm)’이 최대 2000억개 이상이니, 이보다 적다. 다만, KT가 오픈소스로 허깅페이스 등에 공개할 버전(70억개)보다는 많다.
|
이외에도 오디오 이해 모델 ‘큐원-오디오(Qwen-Audio)’와 대화형 버전 ‘큐원-오디오-챗(Qwen-Audio-Chat)’도 공개했다.
큐원-72B는 다양한 언어 작업에서 뛰어난 성능을 보이며, 롤 플레이, 언어 스타일 전환 등의 작업에서 탁월한 능력을 나타낸다.
연구 목적으로 활용하는 경우 무료로 사용 가능하며, 상업적 용도의 경우 월간 활성 사용자 수가 1억 명 미만인 기업에 한해 무료로 제공된다.
경량 버전인 큐원-1.8B는 엣지 장치에서 추론을 가능케 한다. 또, 오디오 이해 모델 ‘큐원-오디오(Qwen-Audio)’는 음성 및 오디오 데이터를 다양하게 해석하고 처리할 수 있는 모델로, 다국어 녹취록 작성, 음성 편집, 오디오 캡션 분석 등 30종류 이상의 오디오 처리 작업을 수행할 수 있다.
이번에 공개된 알리바바 클라우드의 오픈소스 모델은 ‘모델스코프’와 ‘허깅페이스’에서 제공된다.