엔비디아, 최신 MLPerf 훈련에서 블랙웰 아키텍처로 성능 입증

2025-06-05 10:28
편집부 press@bodnara.co.kr

엔비디아가 엔비디아 블랙웰(NVIDIA Blackwell) 아키텍처 기반 AI 플랫폼으로 최신 MLPerf 훈련(MLPerf Training) 벤치마크 전 항목에서 최고 성능을 달성했다고 밝혔다.

엔비디아는 전 세계 기업들과 협력해 AI 팩토리를 구축하고 있으며, 최신 훈련, 추론 기술을 기반으로 차세대 AI 애플리케이션의 훈련과 배포 속도를 높이고 있다.

엔비디아 블랙웰 아키텍처는 이러한 새로운 애플리케이션의 고도화된 성능 요구사항을 충족하도록 설계됐다. 2018년 벤치마크가 도입된 이래 12번째로 진행된 최신 MLPerf 훈련 라운드에서, 엔비디아 AI 플랫폼은 모든 벤치마크 항목에서 최고 수준의 성능을 입증했다. 또한 가장 까다로운 거대 언어 모델(large language model, LLM) 중심 테스트인 라마 3.1 405B(Llama 3.1 405B) 사전 훈련에서 제출된 모든 결과도 엔비디아 플랫폼 위에서 실행됐다.

엔비디아 플랫폼은 유일하게 MLPerf 훈련 v5.0의 모든 벤치마크 항목에 결과를 제출했다. 엔비디아는 LLM, 추천 시스템, 멀티모달 LLM, 객체 감지, 그래프 신경망을 아우르는 광범위한 AI 워크로드에서 탁월한 성능과 범용성을 입증했다.

대규모 출품에는 엔비디아 블랙웰 플랫폼으로 구동되는 두 대의 AI 슈퍼컴퓨터가 사용됐다. 이는 각각 엔비디아 GB200 NVL72 랙 스케일 시스템으로 구성된 티케(Tyche), 엔비디아 DGX B200 시스템을 기반으로 한 닉스(Nyx)이다. 또한 엔비디아는 코어위브(CoreWeave), IBM과 협력해 총 2,496개의 블랙웰 GPU와 1,248개의 엔비디아 그레이스(Grace) CPU를 사용한 GB200 NVL72 결과도 제출했다.

새로운 라마 3.1 405B 사전 훈련 벤치마크에서 블랙웰 아키텍처는 동일한 규모의 이전 세대 대비 2.2배 향상된 성능을 기록했다.

라마 2 70B LoRA 미세 조정 벤치마크에서는 블랙웰 GPU 8개가 탑재된 엔비디아 DGX B200 시스템이 이전 라운드에서 동일 GPU 수로 제출한 결과보다 2.5배 더 높은 성능을 달성했다.

이러한 성능 도약은 블랙웰 아키텍처의 기술적 진보를 잘 보여준다. 여기에는 고밀도 수랭식 랙, 랙당 13.4 테라바이트(TB)의 코히어런트 메모리, 스케일업(scale-up)을 위한 5세대 엔비디아 NV링크(NVLink)와 엔비디아 NV링크 스위치(Switch) 상호연결 기술, 그리고 스케일 아웃(scale-out)을 위한 엔비디아 퀀텀-2 인피니밴드(Quantum-2 InfiniBand) 네트워킹 등이 포함된다. 또한 엔비디아 네모 프레임워크(NeMo Framework) 소프트웨어 스택의 혁신은 에이전틱 AI 애플리케이션 실현에 핵심적인 기반이 되는 차세대 멀티모달 LLM 훈련의 기준을 높였다.

이러한 에이전틱 AI 기반 애플리케이션은 미래의 AI 팩토리에서 작동하게 되며, 이는 곧 에이전틱 AI 경제의 핵심 엔진으로 자리잡을 전망이다. 이러한 새로운 애플리케이션은 토큰과 지능 정보를 생성하며, 거의 모든 산업과 학문 분야에 걸쳐 가치를 창출할 수 있다.

엔비디아 데이터센터 플랫폼에는 GPU, CPU, 고속 패브릭, 네트워킹은 물론 엔비디아 쿠다-X(CUDA-X) 라이브러리, 네모 프레임워크, 엔비디아 텐서RT-LLM(TensorRT-LLM), 엔비디아 다이나모(Dynamo)와 같은 방대한 소프트웨어가 포함된다. 이처럼 정밀한 하드웨어와 소프트웨어 기술 조합은 조직이 AI 모델을 더 빠르게 훈련하고 배포할 수 있게 해 가치 실현 시간을 획기적으로 단축시킨다.

이번 MLPerf 라운드에는 코어위브와 IBM 외에도 다양한 엔비디아 파트너사들이 참여했다. 에이수스(ASUS), 시스코(Cisco), 델 테크놀로지스(Dell Technologies), 기가컴퓨팅(Giga Computing), 구글 클라우드(Google Cloud), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise, HPE), 람다(Lambda), 레노버(Lenovo), 네비우스(Nebius), 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure, OCI), 퀀타 클라우드 테크놀로지(Quanta Cloud Technology), 슈퍼마이크로(Supermicro) 등이 다양한 벤치마크 결과를 제출했다.

닉네임

비회원

보드나라 많이 본 뉴스

AMD Zen6 CPU 올림픽 릿지, iGPU 뺀 자리에 NPU 추가?

카스퍼스키, 월페이퍼 엔진 워크샵 통해 악성 코드 담긴 월페이퍼 유포 경고

엔비디아, 지포스 10 시리즈 포함 보안 취약점 대응 드라이버 배포

보드나라 많이 본 기사

포르자 호라이즌 6와 프래그마타를 즐길 때, 라데온 RX 9000 시리즈 vs 지포스 RTX 50 시리즈

뿌리깊은 나무의 감성 담긴 하이엔드 메인보드, 기가바이트 X870E AERO X3D DARK WOOD 제이씨현

업무와 콘텐츠 소비 모두 고려한 AI 노트북, MSI 프레스티지 14 AI+ D3MG-U9 OLED

보드나라 최신 기사

[06/05] MSI 데스크탑 코덱스, 샵다나와 공식 입점..RTX 50 시리즈 게이밍 AI PC 판매 시작

[06/05] 에이수스, ASUS Business 비전 공개.. AI 시대 기업용 토탈 솔루션 시장 공략 강화

[06/05] 서린씨앤아이, 고성능 메모리 지원 MSI 참 쉬운 컴퓨터 만들기 대회 성황리 종료

[06/05] 아이노비아, 여름철 물놀이 캠핑 필수 아이템 휴대용 에어펌프 ‘비레스트 NOVA PUMP’ 출시

[06/05] HKC 프리미엄 게이밍 브랜드 앤트게이머, 750Hz 초고주사율 모니터 포함 4종 국내 공식 런칭

[06/05] AI PC 시대 프리미엄 비즈니스 노트북, MSI 프레스티지 16 AI+ C3MG-UX9 2.8K OLED

[06/05] 제이씨현, GIGABYTE AORUS 지포스 RTX™ 5090 INFINITY 공식 출시!

[06/05] DDR2 메모리, 2분기 최대 60% 3분기 최대 40% 가격 인상 전망

[06/05] 제이씨현, GIGABYTE Radeon RX 9070 GRE 공식 출시!

[06/05] LG디스플레이, 모니터와 TV 등 대형 OLED 전 제품 색 밝기 정확도 인증 획득

[06/05] SAP, 팀 리퀴드와 e스포츠 경기력 향상 위한 신규 ‘AI 기반 음성 인텔리전스 애플리케이션’ 발표

[06/05] ‘AI 서버 및 데이터센터 시장 공략 강화’ 마이크로닉스, 그레이트월 CRPS 서버 전원 국내 공급

[06/05] AMD, 라데온 RX 7000 시리즈 FSR 4.1 지원과 둠 다크 에이지스 확장팩 지원 드라이버 업데이트

[06/05] NHN두레이, ‘2026 공공 AI 박람회’ 참가

[06/05] 에픽게임즈, ‘언리얼 페스트 서울 2026’ 사전 등록 및 얼리버드 할인 시작

[06/05] 앱코, FL-Esports의 새로운 브랜드 'TNT' 신제품 'TX108' 출시.. 컴퓨존 단독 특가 진행

[06/05] 크래프톤, ‘게임스컴 2026’서 5개 신작 라인업 첫 공개

[06/05] LGE닷컴, 매일 선착순 특가로 ‘국가대표가전 국민 응원 대축제’ 열기 이어간다

[06/05] 이스트소프트-SKT-테라코랩스, 상담사 훈련 돕는 ‘AI 아바타’ 만든다

[06/05] 오픈AI, 사이버 보안 강화를 위한 데이브레이크 확대

로그인 | 이 페이지의 PC버전