인텔, 새로운 AI칩 가우디3 공개…"매력적 대안될 것"

기존 가우디2 AI 학습·추론 성능·생산성 대폭 향상
  • 등록 2024-04-11 오후 3:52:22

    수정 2024-04-11 오후 3:52:22

[이데일리 한광범 기자] 인텔은 9일(현지시간) 미국 피닉스에서 열린 연례 행사 인텔 비전(Intel Vision)에서 기존 모델 대비 BF16용 AI 컴퓨팅에서 4배, 메모리 대역폭에서 1.5배, 대규모 시스템 확장을 위한 네트워킹 대역폭은 2배 향상한 인텔 가우디3 AI 가속기를 선보였다.

팻 겔싱어 인텔 CEO가 9일(현지시간) 미국 피닉스에서 열린 인텔 비전 2024에서 가우디3 AI 가속기를 소개하고 있다. (사진=인텔)
가우디 3는 LLM(대규모 언어 모델) 및 멀티모달 모델에서 AI 학습 및 추론을 위한 성능과 생산성을 대폭 향상했다. 인텔은 업계 유일 MLPerf 벤치마크를 공개한 LLM용 대안인 인텔 가우디2 AI 가속기의 입증된 성능과 효율성을 기반으로 개방형 커뮤니티 기반 소프트웨어 및 업계 표준 이더넷 네트워킹을 통해 고객에게 시스템을 보다 유연하게 확장할 수 있는 선택권을 제공한다.

인텔 DCAI(데이터센터 및 AI) 그룹 총괄 저스틴 호타드(Justin Hotard) 수석 부사장은 “끊임없이 진화하는 AI 시장 환경 속에서 현재 제공되는 제품에는 상당한 격차가 존재한다. 고객과 시장의 피드백에 의하면 선택의 폭이 확대되길 바라는 요구가 있다”라며 “기업은 가용성, 확장성, 성능, 비용, 에너지 효율성 등을 비중있게 고려한다. 인텔 가우디 3는 가격 대비 성능, 시스템 확장성, 가용성 등 모든 측면에서 이점을 갖춘 매력적인 생성형 AI 대안으로 주목받고 있다”고 밝혔다.

금융, 제조, 의료 등 주요 부문의 기업들은 AI에 대한 접근성을 확대하고 실험 단계에서 본격적인 구현으로 전환하는 생성형 AI 프로젝트를 빠르게 모색하고 있는 상황에서 전환을 관리하고 혁신을 촉진하며 매출 성장 목표를 실현하기 위해 기업은 투자 수익률(ROI) 및 운영 효율성 요구를 충족하는 개방적이고 비용 효율적이며 에너지 효율적인 솔루션과 제품을 필요로 한다.

인텔은 가우디 3 가속기가 이러한 요구 사항을 충족하고 개방형 커뮤니티 기반 소프트웨어와 개방형 산업 표준 이더넷을 통해 다양한 기능을 제공해 기업이 AI 시스템과 애플리케이션을 유연하게 확장할 수 있도록 지원하고 있다고 설명했다.

맞춤형 아키텍처로 생성형 AI 성능과 효율성 제공: 효율적인 대규모 AI 컴퓨팅을 위해 설계된 인텔 가우디 3 가속기는 5나노미터(nm) 공정으로 제조되며 이전 제품보다 크게 향상된 성능을 제공한다. MME(Matrix Multiplication Engine), 텐서 프로세서 코어(TPC), 네트워킹 인터페이스 카드(NIC) 등 모든 엔진을 병렬로 활성화할 수 있도록 설계되어 빠르고 효율적인 딥러닝 연산 및 확장에 필요한 가속화를 지원한다. 주요 기능은 다음과 같다.

인텔은 가우디3 가속기가 고성능, 고효율 생성형 AI 컴퓨팅을 위해 설계됐다며 높은 수준의 연산 효율성을 제공하고 딥 러닝 알고리즘의 기본 연산 유형인 복잡한 행렬 연산을 능숙하게 처리할 수 있다고 강조했다. 가우디 3만의 설계는 병렬 AI 작업의 속도와 효율성을 가속화하고 FP8 및 BF16을 비롯한 여러 데이터 유형을 지원한다고 부연했다.

인텔 가우드3 AI 가속기. (인텔 제공)
또 인텔 가우디 소프트웨어는 파이토치(PyTorch) 프레임워크를 통합하며 오늘날 생성형 AI 개발자에게 가장 널리 사용되는 AI 프레임워크인 허깅 페이스(Hugging Face) 커뮤니티 기반 최적화 모델을 제공한다. 이를 통해 생성형 AI 개발자는 높은 추상화 수준에서 작업하여 사용 편의성과 생산성을 높이고 하드웨어 유형 간에 모델을 쉽게 이식할 수 있다.

인텔은 가우디3가 엔비디아 H100 대비 일부 매개변수 모델에서 학습시간을 50% 단축하고, 50% 빠른 추론 처리량을 보이며 40% 향상된 추론 전력 효율성을 제공한다고 강조했다.

인텔 은가우디 3 가속기를 올해 2분기에 범용 베이스보드 및 개방형 가속기 모듈(OAM)의 산업 표준 구성으로 OEM에 제공할 예정이라고 전했다. 가우디3를 시장에 출시할 주요 OEM 업체는 델 테크놀로지스(Dell Technologies), HPE, 레노보(Lenovo), 슈퍼마이크로(Supermicro) 등이다. 가우디3 가속기의 GA(General availability)는 올해 3분기로 예정돼 있다.

인텔은 가우디 3 가속기가 학습 및 추론을 위한 여러 비용 효율적인 클라우드 LLM 인프라를 지원해 기업들에게 가격 대비 성능의 이점과 선택권을 제공할 것이라고 설명했다.

팻 겔싱어 인텔 CEO는 “혁신은 전례없는 속도로 발전하고 있으며, 반도체가 이 모든 것을 가능하게 한다. 또한 모든 기업이 빠르게 AI 기업으로 거듭나고 있다”며 “인텔은 PC부터 데이터센터, 엣지에 이르기까지 기업 전반의 모든 곳에 AI를 가능하게 하고 있다. 인텔의 최신 가우디, 제온 및 코어 울트라 플랫폼은 변화하는 고객과 파트너의 요구를 충족하고 앞으로의 엄청난 기회를 활용할 수 있도록 유연한 솔루션 세트를 제공하고 있다”고 밝혔다.

이데일리
추천 뉴스by Taboola

당신을 위한
맞춤 뉴스by Dable

소셜 댓글

많이 본 뉴스

바이오 투자 길라잡이 팜이데일리

왼쪽 오른쪽

스무살의 설레임 스냅타임

왼쪽 오른쪽

재미에 지식을 더하다 영상+

왼쪽 오른쪽

두근두근 핫포토

  • '집중'
  • 사실은 인형?
  • 왕 무시~
  • 박결, 손 무슨 일?
왼쪽 오른쪽

04517 서울시 중구 통일로 92 케이지타워 18F, 19F 이데일리

대표전화 02-3772-0114 I 이메일 webmaster@edaily.co.krI 사업자번호 107-81-75795

등록번호 서울 아 00090 I 등록일자 2005.10.25 I 회장 곽재선 I 발행·편집인 이익원

ⓒ 이데일리. All rights reserved