업스테이지 솔라 논문, 자연어 처리 학회 ‘NAACL’ 채택

글로벌 3대 자연어처리 학회
LLM의 깊이 차원을 확장해
모델 규모 늘리는 DUS 방법론
지난 3년간 국내외 AI 논문 110여건 발표
글로벌 톱 7 자연어처리 학회 모두 휩쓸어
  • 등록 2024-03-31 오전 8:19:21

    수정 2024-03-31 오전 8:19:21

[이데일리 김현아 기자]업스테이지가 개발한 세계 최고 수준의 거대언어모델(LLM) 솔라 개발 논문이 글로벌 탑티어 자연어 처리(NLP) 학회에 채택됐다.



업스테이지(대표 김성훈)는 세계 최고 권위의 NLP 학회인 ‘NAACL 2024(북미 전산언어 학회: Annual Conference of the North American Chapter of the Association for Computational Linguistics)’에서 솔라 개발 논문을 발표한다.

NAACL이 뭔데?

NAACL은 ACL(Association for Computational Linguistics), EMNLP(Empirical Methods in Natural Language Processing)와 함께 세계 3대 NLP 학회로 꼽힌다.

매년 구글, 메타, 아마존 등 글로벌 빅테크 기업과 수천여 명의 NLP 연구자들이 참여해 최신 연구성과를 공유하며, 올해 학회는 6월 16일부터 21일까지 멕시코시티에서 열린다.

이번 NAACL 2024에 채택된 업스테이지 논문은 김다현 연구원, 박찬준 수석 연구원 등의 주도로 김성훈 대표, 이활석 최고기술책임자(CTO) 등 주요 경영진까지 모두 참여한 업스테이지 기술력의 집약체다.

자연어처리 최고 권위 학회 NAACL 2024에 채택된 업스테이지 논문 ‘SOLAR 10.7B: Scaling Large Language Models with Simple yet Effective Depth Up-Scaling’


LLM의 깊이 차원 확장해 모델 규모 늘려

해당 논문은 ‘깊이 확장 스케일링(DUS: Depth-Up Scaling)’이라는 기법으로 LLM의 깊이 차원을 확장하여 모델 규모를 늘리는 새로운 방법론을 제시했다.

거대언어모델(LLM)은 텍스트 입력에서 처리, 출력까지 다양한 층위의 신경망 레이어(layer)로 구성되는데, 이러한 레이어를 조합해 모델의 성능을 끌어올리는 방식이다.

구체적으로 업스테이지는 ‘라마(Llama) 2’ 아키텍처인 ‘미스트랄(Mistral) 7B’를 기반으로 DUS 기법을 적용해 모델의 깊이 차원을 확장,107억 매개변수(파라미터)로 구성된 ‘솔라 10.7B’ 모델을 개발했다.

업스테이지 솔라는 작년 12월 알리바바 ‘큐원(Qwen)’의 6분의 1도 안되는 크기로 미스트랄AI의 ‘믹스트랄(Mixtral 8x7B)’ 등 빅테크의 대형 모델을 제치고 머신러닝 플랫폼 허깅페이스의 ‘오픈 LLM 리더보드’에서 세계 1위를 차지, DUS 기법의 우수성을 직접 입증해 보였다.

이로써 업스테이지는 자체 LLM을 개발한 기술력을 세계적 권위의 학회에서 과시하는 쾌거를 거뒀다.

특히, 솔라의 핵심인 사전 훈련된 가중치를 기반으로 추가 학습하여 모델 사이즈는 작지만 강력한 모델을 만드는 DUS 방법론을 공식 인정받았음을 의미한다고 회사 측은 설명했다.

김성훈 업스테이지 대표
중국 유니콘 기업도 활용


최근 중국 AI 유니콘 기업 01.AI에서 DUS를 활용해 자체 언어모델 ‘Yi’를 개발하는 등 글로벌 적용 사례들도 생겨나고 있다.

지금까지 업스테이지는 국내외 AI 관련 논문 110여 편을 발표하고, 구글 스콜라 랭킹 기준 톱 7 NLP 분야 컨퍼런스에서 모두 논문 채택을 달성하는 등 연구 저력을 이어가고 있다.

구글 스콜라 랭킹은 학술정보 전문 검색 서비스인 구글 스콜라가 논문의 인용 횟수에 따라 평가, 학회의 영향력을 측정하는 권위 있는 지표다. NLP 분야 톱 7 컨퍼런스로는 ACL, EMNLP, NAACL, TACL, COLING, LREC, WMT가 꼽히고, 이중 저널로 구분되는 TACL을 제외한 모든 컨퍼런스에서 논문 성과를 이룬 것이다.

김성훈 업스테이지 대표는 “세계 최고 수준의 언어모델 솔라를 개발한 업스테이지의 기술력을 글로벌 탑티어 학회에서 인정받게 되어 기쁘다”라며 “앞으로 업스테이지는 세계 최고 AI 기술력을 토대로 국내는 물론 해외 시장을 주도할 수 있는 강력한 LLM 개발에 힘쓸 것”이라고 밝혔다.

이데일리
추천 뉴스by Taboola

당신을 위한
맞춤 뉴스by Dable

소셜 댓글

많이 본 뉴스

바이오 투자 길라잡이 팜이데일리

왼쪽 오른쪽

스무살의 설레임 스냅타임

왼쪽 오른쪽

재미에 지식을 더하다 영상+

왼쪽 오른쪽

두근두근 핫포토

  • 처참한 사고 현장
  • 미모가 더 빛나
  • 빠빠 빨간맛~♬
  • 이부진, 장미란과 '호호'
왼쪽 오른쪽

04517 서울시 중구 통일로 92 케이지타워 18F, 19F 이데일리

대표전화 02-3772-0114 I 이메일 webmaster@edaily.co.krI 사업자번호 107-81-75795

등록번호 서울 아 00090 I 등록일자 2005.10.25 I 회장 곽재선 I 발행·편집인 이익원

ⓒ 이데일리. All rights reserved