quickmenu
PC 뉴스 홈  

엔비디아, MLPerf 벤치마크서 AI 훈련 성능 입증

2021-12-03 10:05
편집부 press@bodnara.co.kr

엔비디아(CEO 젠슨 황)가 MLPerf 벤치마크에서 엔비디아 AI 기반 시스템을 통해 훈련 성능을 입증했다고 밝혔다.

 

델 테크놀로지스(Dell Technologies), 인스퍼(Inspur), 슈퍼마이크로(Supermicro) 및 마이크로소프트 애저(Microsoft Azure)는 엔비디아 AI를 사용해 MLPerf 벤치마크 AI 트레이닝 부문에서 신기록을 세웠다. 해당 시스템들은 새롭게 발표된 MLPerf 트레이닝(training) 1.1의 주요 워크로드 8개 부문 모두에서 기록을 경신했다

MLPerf 벤치마크에서 엔비디아 A100 텐서 코어(Tensor Core) GPU는 각 시스템에 최고 수준의 표준화된 칩당 성능(per-chip performance)을 제공했다. 엔비디아 인피니밴드(InfiniBand) 네트워킹 및 소프트웨어 스택은 엔비디아 DGX 슈퍼(Super)POD 기반 AI 슈퍼컴퓨터 셀린(Selene)의 훈련 시간을 획기적으로 단축했다.

 

최근 결과에 따르면 AI 모델 훈련 부문에서 애저의 NDm A100 v4 인스턴스가 전세계에서 가장 빠른 것으로 입증됐다. NDm A100 v4는 해당 벤치마크의 모든 테스트를 거쳤으며 2,048개의 A100 GPU로 확장된 시스템이다.

테스트에서 우수한 성능을 보여준 애저의 시스템은 현재 미국 전역 6개 지역에서 대여 및 사용 가능하다.

AI 훈련은 고도의 사양을 요구하는 복잡한 작업이다. 엔비디아는 사용자가 선호하는 서비스나 시스템을 사용해 기록적인 속도로 모델을 훈련하도록 지원한다. 이는 엔비디아 AI가 클라우드 서비스, 코로케이션(co-location) 서비스, 기업 및 과학 컴퓨팅 센터용 제품을 폭넓게 지원하는 이유이다.

OEM 중 인스퍼는 8방향 GPU 시스템 NF5688M6과 액상 냉각식 NF5488A5를 사용해 단일 노드 성능에서 가장 우수한 기록을 세웠다. 한편, 델과 슈퍼마이크로는 4방향 A100 GPU 시스템에서 신기록을 세웠다.

8개의 OEM과 2개의 클라우드 서비스를 비롯해 총 10개의 엔비디아 파트너가 테스트 결과를 제출했으며, 이들의 결과는 제출된 모든 결과의 90% 이상을 차지했다. 이는 엔비디아 생태계와 관련해 진행된 역대 MLPerf 트레이닝 테스트에서 5번째로 우수한 결과이다.

엔비디아 파트너들이 참여하는 MLPerf는 AI 훈련 및 추론을 위한 유일한 업계 표준 벤치마크이며, AI 플랫폼과 공급업체를 평가하는 고객에게 이는 중요한 지표가 된다.

 

바이두 패들패들(Baidu PaddlePaddle), 델 테크놀로지스, 후지츠(Fujitsu), 기가바이트(GIGABYTE), 휴렛 팩커드 엔터프라이즈(Hewlett Packard Enterprise), 인스퍼, 레노버(Lenovo) 및 슈퍼마이크로는 로컬 데이터 센터에 단일 및 다중 노드의 작업에서 실행되는 결과를 제출했다.

대부분의 OEM 파트너는 가속화 컴퓨팅을 추구하는 기업 고객을 위해 검증된 서버인 엔비디아 인증 시스템(NVIDIA-Certified Systems)에서 테스트를 실행했다.

광범위하게 제출된 결과를 통해 엔비디아는 모든 규모의 기업에 최적의 솔루션을 제공하는 엔비디아 플랫폼의 다양성과 전문성을 입증했다.

 

엔비디아 AI는 모든 벤치마크 및 활용사례를 제출하는 데 사용된 유일한 플랫폼 참가자이며, 이를 통해 고성능 및 다용도성을 증명했다. 빠르고 유연한 시스템은 고객이 작업 속도를 높이는 데 필수적인 생산성을 지원한다.

AI 훈련 벤치마크는 컴퓨터 비전, 자연어 처리, 추천 시스템, 강화 학습 등 오늘날 가장 인기있는 AI 워크로드 및 시나리오 8가지를 다룬다.

MLPerf 테스트의 투명하고 객관적인 결과를 활용해 사용자들은 정보에 입각한 구매결정을 내릴 수 있다. 2018년 5월 결성된 업계 벤치마킹 그룹은 알리바바(Alibaba), Arm, 구글(Google), 인텔(Intel) 및 엔비디아를 비롯한 수많은 업계 리더들의 지원을 받고 있다.

이와 같은 수치는 지난 18개월 동안 A100 GPU의 성능이 5배 이상 향상되었음을 보여준다. 이는 오늘날 엔비디아의 작업에서 큰 비중을 차지하는 소프트웨어의 지속적인 혁신 덕분이다.

엔비디아의 성능은 3년 전 처음 MLPerf 테스트가 실행된 이후 20배 이상 향상되었다. 이렇게 획기적인 속도 향상은 GPU, 네트워크, 시스템 및 소프트웨어의 풀 스택 제품 전반에 걸친 발전의 결과이다.

 

엔비디아는 여러 소프트웨어 개선을 통해 지속적으로 발전해 왔다. 예를 들어, 새로운 클래스의 메모리 복사 작업을 통해 의료 영상용 3D-UNet 벤치마크에서 2.5배 빠른 속도를 달성했다.

병렬처리를 위한 GPU 미세 조정 방법 덕분에 객체감지를 위한 Mask R-CNN 테스트 속도가 10%가량 향상됐고, 추천 시스템의 경우 27% 향상됐다. 엔비디아는 많은 GPU에서 실행되는 작업에 특히 효과적인 기술로서 독립적인 작업을 중첩시켰다.

엔비디아는 호스트 CPU와의 통신을 최소화하기 위해 CUDA 그래프 사용을 확대했다. 이를 통해 이미지 분류를 위한 ResNet-50 벤치마크에서 6% 향상된 성능을 제공했다.

또한, GPU 간 통신을 최적화하는 라이브러리인 NCCL에서 두 가지 새로운 기술을 구현했다. 그 결과 BERT와 같은 대규모 언어 모델에서 최대 5% 가속화된 성능을 기록했다.

엔비디아가 사용한 모든 소프트웨어는 누구든지 MLPerf 리포지토리에서 이용할 수 있다. 엔비디아는 GPU 애플리케이션을 위한 소프트웨어 허브 NGC의 컨테이너에 다양한 최적화 사항을 지속적으로 추가하고 있다.

이는 최신 업계 벤치마크에서 입증된 풀 스택 플랫폼의 일부이며, 오늘날 실질적인 AI 작업을 처리하는 다양한 파트너에게 제공된다.

닉네임 lock
비회원

보드나라 많이 본 뉴스
보드나라 많이 본 기사

보드나라 최신 기사
[12/03] AI 인프라 기업 ㈜코코링크 고밀도 컴퓨팅 서버 ‘Klimax-408’ 신제품 출시 기자간담회 개최  
[12/03] 둠 더 다크 에이지스, 패스 트레이싱과 자체 벤치마크 기능 업데이트  
[12/03] 넥슨, ‘던전앤파이터 모바일’ 신규 재해 던전 ‘파광의 아스마르’ 출시!  
[12/03] 알리바바 클라우드, 국내 제2 데이터센터 공식 출범  
[12/03] 캐논코리아, 웨어러블 로봇 기업 헥사휴먼케어와 메디컬 비즈니스 확장 위한 업무협약(MOU) 체결  
[12/03] 대원씨티에스, 기가바이트 초소형 미니PC 'GB-BER7-8840' 국내 출시  
[12/03] 그라비티, 라그나로크 IP 타이틀 2종 ‘드래곤 길들이기’ 콜라보레이션 실시!  
[12/03] 인디 감성 담은 소울라이크 액션 ‘네더월드 커버넌트’ 얼리 액세스 출시!  
[12/03] FSR4 공식 미지원 라데온 RX 7000 시리즈에 강제 적용하면?  
[12/03] 브리츠, C타입 유선이어폰 'BZ-WE900P' 출시  
[12/03] 월드 오브 워크래프트 내부 전쟁, 신규 콘텐츠 업데이트 아라소르의 유산 적용  
[12/03] 성능과 전력 효율의 밸런스를 추구하는 사용자들에게 적합한 HP 노바 16 런칭  
[12/03] 니콘이미징코리아, ‘니콘 이미징 레시피’ 전용 스페셜 페이지 오픈  
[12/03] 에이수스, 초고주사율 기반의 ROG 및 TUF Gaming 모니터 2종 출시  
[12/03] 크래프톤, 세계 최대 게임쇼 ‘게임스컴 2025’ 참가  
[12/03] 타포, Tapo H110 스마트 IR 리모컨 출시  
[12/03] 서린씨앤아이, 클레브 신규 컬러 모델 '피트 V 블랙' 추가 출시  
[12/03] 젠하이저, 창립 80주년 기념 ‘루비 레드 HD 25 에디션’ 증정 이벤트 진행  
[12/03] 퓨어스토리지, 데이터 및 스토리지 관리의 새로운 기준 ‘엔터프라이즈 데이터 클라우드’ 발표  
[12/03] 슈퍼마이크로, AMD 인스팅트 MI350 탑재 AI 솔루션 출시  
로그인 | 이 페이지의 PC버전
Copyright NexGen Research Corp. 2010