머신러닝 역량 인정받은 두나무…국제 학술대회 ‘콜링’서 논문 발표

  • 등록 2025-01-23 오전 9:10:29

    수정 2025-01-23 오전 9:10:29

[이데일리 김가은 기자] 블록체인·핀테크 전문기업 두나무는 세계 최고 수준 국제전산언어학술대회인 ‘콜링2025’ 콘퍼런스에서 본사 머신러닝(ML)팀의 텍스트-SQL(구조화된 질의 언어) 변환 관련 연구 논문을 발표, 기술적 우수성을 입증했다고 23일 밝혔다.

(사진=두나무)
콜링(COLING)은 자연어 처리(NLP)와 전산언어학 분야에서 세계적으로 권위 있는 학회 중 하나다. 제출된 전체 논문의 30% 정도만 채택될 정도로 엄격한 기준을 자랑한다. 구글 스칼라(Google Scholar)가 발표한 전산 언어학 분야 글로벌 상위 5대 학회에도 포함된다.

올해 콜링의 메인 콘퍼런스는 지난 21일(현지 시각) 아랍에미리트(UAE) 아부다비 ADNEC(Abu Dhabi National Exhibition Centre)에서 열렸다. 이 자리에서 이동준 두나무 머신러닝팀장은 두나무가 개발한 텍스트-SQL 변환 모델의 연구 성과를 직접 발표했다.

이번 발표 논문의 제목은 ‘MCS-SQL: 텍스트-SQL 변환에서 다중 프롬프트와 다지선다를 활용하는 방법(원문 논문명: MCS-SQL: Leveraging Multiple Prompts and Multiple-Choice Selection For Text-to-SQL Generation)’이다. 해당 논문은 거대언어모델(LLM) 기반의 텍스트-SQL 변환 성능을 향상시키는 방법을 제안했다.

기존 LLM은 질문 방식이나 문장 배치순서 등에 따라 답변이 확연히 달라지는 비일관성이라는 한계점이 있었다. 예를 들어 “A와 B는 같은 뜻인가요?”와 “B와 A는 같은 뜻인가요?”라는 질문에 서로 다른 답변을 내놓을 수 있다는 것이다. 두나무 머신러닝팀은 이러한 문제를 해결하기 위해 다중 프롬프트 기법을 도입, 여러 SQL 후보를 생성한 뒤 최적의 SQL을 선택하는 방법을 제안했다. 이 방법은 기존 LLM의 정확도와 효율성을 동시에 향상할 수 있다는 연구 결과다. 이 모델은 지난해 1월 텍스트-SQL 변환 측정 벤치마크인 BIRD-SQL 글로벌 리더보드에서 1위를 차지하는 등 우수성을 증명하기도 했다.

이 팀장은 “생성형 AI와 함께 주목받는 텍스트-SQL 변환 분야에 대한 기술적 도전이 세계적으로 인정 받아 기쁘다”며 “이번 연구가 AI의 실질적 활용성을 넓히는데 조금이나마 보탬이 됐으면 좋겠다”고 말했다.

이데일리
추천 뉴스by Taboola

당신을 위한
맞춤 뉴스by Dable

소셜 댓글

많이 본 뉴스

바이오 투자 길라잡이 팜이데일리

왼쪽 오른쪽

MICE 최신정보를 한눈에 TheBeLT

왼쪽 오른쪽

재미에 지식을 더하다 영상+

왼쪽 오른쪽

두근두근 핫포토

  • 김채연 '금빛 연기'
  • 최진실 딸 변신
  • 딱 걸렸어
  • 한파에도 깜찍
왼쪽 오른쪽

04517 서울시 중구 통일로 92 케이지타워 18F, 19F 이데일리

대표전화 02-3772-0114 I 이메일 webmaster@edaily.co.krI 사업자번호 107-81-75795

등록번호 서울 아 00090 I 등록일자 2005.10.25 I 회장 곽재선 I 발행·편집인 이익원 I 청소년보호책임자 고규대

ⓒ 이데일리. All rights reserved