Loading...

AI 뉴스

Nvidia가 기록적인 훈련 시간으로 AI 벤치마크를 석권하다

페이지 정보

작성자 xtalfi
작성일 2025.11.13 14:49
1,464 조회
0 추천
0 비추천

본문

smfS6N7aideSB7eA7JSz2H-1920-80.jpg

(퍼플렉시티가 정리한 기사)


NVIDIA는 화요일에 발표된 MLPerf Training v5.1 벤치마크에서 완전한 석권을 달성하여 7개 테스트 모두에서 가장 빠른 훈련 시간을 기록했으며, 모든 카테고리에서 결과를 제출한 유일한 플랫폼이 되었습니다. 이 회사는 5,120개의 Blackwell GPU를 사용하여 Meta의 Llama 3.1 405B 모델을 단 10분 만에 훈련시켜 새로운 업계 기록을 세웠으며, 이는 이전 최고 기록보다 2.7배 빠른 속도입니다.​

11월 12일 MLCommons에서 발표한 이번 결과는 MLPerf Training 역사상 어떤 회사도 4비트 FP4 정밀도를 사용한 첫 번째 사례로, 이 획기적인 기술은 동일한 수의 GPU에서 이전 세대 Hopper 아키텍처보다 최대 4배의 성능을 제공했습니다. NVIDIA의 독점 NVFP4 포맷은 엄격한 정확도 요구사항을 유지하면서 8비트 FP8보다 3배 빠른 속도로 계산을 가능하게 합니다.​


블랙웰 울트라 데뷔하다

Blackwell Ultra 기반 GB300 NVL72 랙 규모 시스템이 이번 라운드에서 MLPerf Training에 처음 등장했으며, 표준 Blackwell GPU보다 1.5배 높은 NVFP4 처리량과 어텐션 레이어를 위한 2배의 softmax 가속을 제공하는 향상된 Tensor Core를 특징으로 합니다. 이 시스템은 GPU당 279GB의 HBM3e 메모리를 탑재하고 NVIDIA Quantum-X800 InfiniBand를 통해 업계 최초의 800 Gb/s 네트워킹 플랫폼으로 연결됩니다.​

NVIDIA는 또한 새로 도입된 두 가지 벤치마크인 Llama 3.1 8B와 FLUX.1 이미지 생성에서 성능 기록을 세웠습니다. 이 회사는 512개의 Blackwell Ultra GPU를 사용하여 5.2분 만에 Llama 3.1 8B를 학습시켰으며, FLUX.1에 대한 결과를 제출한 유일한 플랫폼으로서 1,152개의 Blackwell GPU로 12.5분의 학습 시간을 달성했습니다.​


다양한 경쟁 분야

MLPerf Training v5.1 라운드에는 20개 조직이 참여하여 12개의 서로 다른 하드웨어 가속기를 탑재한 65개의 고유한 시스템을 제출했습니다. AMD는 새로운 Instinct MI355X 및 MI350X GPU를 선보였으며, AMD는 단일 노드 접근성을 위해 설계된 새로운 Llama 3.1 8B 벤치마크 개발을 주도했습니다. AMD에 따르면, MI355X GPU 성능은 Llama 3.1 8B 테스트에서 NVIDIA의 Blackwell 플랫폼 대비 5-6% 이내의 차이를 보였습니다.​

전체 제출물의 거의 절반이 멀티 노드 구성이었으며, 이는 전년도 라운드 대비 86% 증가한 수치입니다. Datacrunch, University of Florida, Wiwynn이 처음으로 참여했으며, Dell, HPE, Lenovo와 같은 기존 참가자들도 함께했습니다.​

벤치마크 업데이트에서는 레거시 테스트를 최신 AI 워크로드로 대체했습니다: 언어 모델의 경우 BERT를 Llama 3.1 8B로, 이미지 생성의 경우 Stable Diffusion v2를 FLUX.1로 교체했습니다.

댓글 0
전체 1,366 / 26 페이지
• 엑서터 대학교(University of Exeter) 연구진은 AI 챗봇이 평판 훼손, 정서적 피해, 사회적 혼란을 야기하는 “야생형(feral)” 가십을 만들어 퍼뜨리고 있으며, 인간 의사소통을 조절하는 사회적 규범의 통제를 받지 않은 채 작동하고 있다고 경고했다.• Ethics and Information Technology에 게재된 이 연구는 AI 시스템들 사이에서 빠르게 확산되는 위험한 “봇-투-봇(bot-to-bot)” 가십을 강조하며, 챗봇이 **호주 시장 브라이언 후드(Brian Hood)**에게 뇌물 수수 혐의를, 라디오 진행자 **마크 월터스(Mark Walters)**에게 횡령 혐의를 거짓으로 뒤집어씌운 사례 등을 문서화했다.• 연구진은 기술 기업들이 메모리 기능, 음성 모드와 같은 개인화 기능을 갖춘 챗봇을 설계함에 따라, AI 가십이 더욱 만연해질 것이며, 그 결과 이용자들이 신뢰할 만한 정보와 함께 근거 없는 비난도 더 쉽게 수용하게 될 것이라고 예측한다.
616 조회
0 추천
2025.12.25 등록
• 애플은 2026년 말 공개를 목표로, 코드명 N50인 AI 기반 스마트 글라스를 개발 중이며, 이는 메타의 레이밴(Ray-Ban) 협업 제품과 경쟁하게 될 것으로 알려졌다. 이 제품은 개편된 시리를 통한 음성 기반 AI와, 디스플레이 없이도 시각 지능을 구현하기 위한 다수의 카메라를 탑재할 예정이라고 사안에 정통한 관계자들은 전했다.• 회사는 글라스 프로젝트에 자원을 집중하기 위해 더 가벼운 버전의 비전 프로(Vision Pro) 후속 모델 계획을 보류했으며, 이 스마트 글라스는 애플 워치처럼 아이폰과 페어링되고, 전력 효율에 최적화된 S-클래스 칩을 사용할 예정이다. 출하는 2027년 시작이 예상된다.• 애플은 또한 비주얼 룩 업(Visual Look Up)과 상황 인지형 알림 등 기능을 갖춘 AI 강화 에어팟(AirPods)을 선보일 계획이며, 이 시장에서 현재 메타가 약 60%의 점유율을 차지하고 있고, 애널리스트들은 AI 글라스 분야가 2030년까지 매년 100% 이상 성장할 것으로 전망하고 있다.
596 조회
0 추천
2025.12.22 등록
삼성전자가 엔비디아의 차세대 HBM4 테스트에서 구동 속도와 전력 효율 면에서 ‘최우수’ 평가를 받으며, 내년 공급 물량의 30% 이상을 차지할 것으로 전망된다.삼성전자의 HBM4는 초당 11Gbps 이상의 속도를 구현하고 전력 효율을 전 세대 대비 40% 개선했으며, 올해 3분기 HBM 시장 점유율 22%로 마이크론을 제치고 2위를 탈환했다.HBM4는 내년 하반기 출시 예정인 엔비디아의 차세대 AI 가속기 ‘베라 루빈’에 탑재될 핵심 부품으로, 삼성전자는 1분기 정식 계약 체결 후 2분기부터 본격 공급을 시작할 예정이다.
595 조회
0 추천
2025.12.22 등록
Nvidia는 40,000시간의 게임플레이 영상으로 학습된 오픈소스 AI 모델 NitroGen을 공개했으며, 이는 1,000개 이상의 비디오 게임을 플레이할 수 있고 처음 보는 게임에서 처음부터 학습된 모델 대비 작업 성공률이 52% 향상되었습니다.이 모델은 Nvidia의 GROOT N1.5 로봇공학 아키텍처를 기반으로 구축되었으며, 연구진은 이 기술이 예측 불가능한 환경에서 작동하는 로봇을 포함한 실제 응용 분야를 발전시킬 수 있다고 말하며, 모든 데이터셋, 코드 및 모델 가중치를 공개적으로 공개했습니다.이 발표는 게임 커뮤니티에서 경쟁적인 온라인 게임에서의 잠재적 오용에 대한 우려를 불러일으켰으며, 업계 데이터에 따르면 게이머의 80%가 이미 치팅을 경험하고 있고 이 AI는 인간 플레이어와 봇을 구별하기 어렵게 만들 수 있습니다.
603 조회
0 추천
2025.12.22 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입