|
이번 조치는 그간 미국과 중국의 빅테크 기업들이 주도해온 생성형 AI 시장에 한국형 모델의 존재감을 각인시키는 한편, 스타트업과 중소기업의 AI 접근성을 크게 높일 수 있는 계기가 될 것으로 평가된다.
23일 네이버클라우드는 자사의 초대규모 AI ‘하이퍼클로바X’ 기반으로 개발된 경량 언어모델 3종을 오픈소스 플랫폼 ‘허깅페이스’를 통해 외부에 공개한다고 밝혔다. 공개된 모델은 각각 파라미터 수 기준으로 △하이퍼클로바X 시드 3B(30억개) △하이퍼클로바X 시드 1.5B △하이퍼클로바X 시드 0.5B 등이며, 텍스트뿐 아니라 이미지와 영상 정보를 처리할 수 있는 시각 언어모델 기능도 포함돼 있다.
특히 이번 모델 공개는 단순한 연구용 모델 제공이 아니라, 상업적 활용까지 가능한 오픈소스라는 점에서 주목된다. 그동안 국내외에서 연구 목적의 오픈소스는 다수 존재했지만, 네이버가 이번에 공개한 모델은 기업들이 실제 비즈니스에 바로 적용할 수 있도록 설계돼 경량 LLM 분야의 기술적 독립성과 시장 개방성을 동시에 확보하려는 전략적 행보로 풀이된다.
|
이번에 공개된 경량 모델 중 가장 고성능을 자랑하는 시드 3B 모델은 30억개의 파라미터를 보유해, 텍스트 처리뿐 아니라 이미지·영상 정보 이해, 도표 해석, 개체 인식, 사진 묘사 등의 다양한 시각 언어 처리 능력을 갖췄다. 특히 한국어와 한국문화, 영어 관련 시각정보 이해 능력을 평가하는 9개 벤치마크의 평균 점수에서 시드 3B 모델은 59.54점을 기록, 글로벌 유수 모델인 큐웬 2.5-VL-3B(56.55점), 지피티4V(54.83점), 젬마 3-4B(47.98점)를 능가하는 성능을 입증했다.
정보기술(IT) 업계는 이번 네이버(NAVER(035420))의 행보가 생성형 AI 시장에서 한국형 모델의 경쟁력을 확보하는 전환점이 될 수 있다고 예상했다. 특히 로봇, 자율주행차 등 다양한 산업 기기와의 결합을 통해 얼마나 정교하고 실용적인 서비스를 구현할 수 있느냐가 향후 경쟁의 핵심이라는 분석이다.
이민석 국민대 소프트웨어학부 교수는 “이번 모델이 상업용으로 쓸 수 있게 공개됐다는 점에서 매우 바람직한 일”이라고 평가하며 “AI 모델은 단순히 구조가 좋다고 해서 성능이 보장되는 것이 아니다”라고 말했다. 그는 “실제로는 훈련 방식, 데이터셋, 튜닝 노하우가 성능을 결정한다”며 “제대로 훈련돼 안정적인 결과를 낼 수 있느냐가 핵심”이라고 강조했다.
또한, 네이버클라우드는 하이퍼클로바X의 플래그십 모델을 기반으로 상반기 내 추론 모델을 선보일 계획이다. 해당 모델은 수학, 프로그래밍 분야에서 높은 정확도를 보이며, 시각·음성 정보 이해, 자동 웹 검색, 응용프로그램인터페이스(API) 호출, 데이터 분석 등 다양한 고도화 기능을 제공할 예정이다.
전문가들은 이미 다수의 언어모델이 오픈소스로 공개된 상황에서 앞으로의 경쟁력은 얼마나 정밀하게 모델을 파인튜닝(미세조정)하고 실질적인 서비스에 접목시킬 수 있느냐에 달려 있다고 본다. 네이버의 이번 모델 공개가 한국형 AI 생태계의 확장과 자립을 촉진할 수 있을지 주목된다.