Loading...

AI 뉴스

Nvidia가 기록적인 훈련 시간으로 AI 벤치마크를 석권하다

페이지 정보

작성자 xtalfi
작성일 2025.11.13 14:49
1,074 조회
0 추천
0 비추천

본문

smfS6N7aideSB7eA7JSz2H-1920-80.jpg

(퍼플렉시티가 정리한 기사)


NVIDIA는 화요일에 발표된 MLPerf Training v5.1 벤치마크에서 완전한 석권을 달성하여 7개 테스트 모두에서 가장 빠른 훈련 시간을 기록했으며, 모든 카테고리에서 결과를 제출한 유일한 플랫폼이 되었습니다. 이 회사는 5,120개의 Blackwell GPU를 사용하여 Meta의 Llama 3.1 405B 모델을 단 10분 만에 훈련시켜 새로운 업계 기록을 세웠으며, 이는 이전 최고 기록보다 2.7배 빠른 속도입니다.​

11월 12일 MLCommons에서 발표한 이번 결과는 MLPerf Training 역사상 어떤 회사도 4비트 FP4 정밀도를 사용한 첫 번째 사례로, 이 획기적인 기술은 동일한 수의 GPU에서 이전 세대 Hopper 아키텍처보다 최대 4배의 성능을 제공했습니다. NVIDIA의 독점 NVFP4 포맷은 엄격한 정확도 요구사항을 유지하면서 8비트 FP8보다 3배 빠른 속도로 계산을 가능하게 합니다.​


블랙웰 울트라 데뷔하다

Blackwell Ultra 기반 GB300 NVL72 랙 규모 시스템이 이번 라운드에서 MLPerf Training에 처음 등장했으며, 표준 Blackwell GPU보다 1.5배 높은 NVFP4 처리량과 어텐션 레이어를 위한 2배의 softmax 가속을 제공하는 향상된 Tensor Core를 특징으로 합니다. 이 시스템은 GPU당 279GB의 HBM3e 메모리를 탑재하고 NVIDIA Quantum-X800 InfiniBand를 통해 업계 최초의 800 Gb/s 네트워킹 플랫폼으로 연결됩니다.​

NVIDIA는 또한 새로 도입된 두 가지 벤치마크인 Llama 3.1 8B와 FLUX.1 이미지 생성에서 성능 기록을 세웠습니다. 이 회사는 512개의 Blackwell Ultra GPU를 사용하여 5.2분 만에 Llama 3.1 8B를 학습시켰으며, FLUX.1에 대한 결과를 제출한 유일한 플랫폼으로서 1,152개의 Blackwell GPU로 12.5분의 학습 시간을 달성했습니다.​


다양한 경쟁 분야

MLPerf Training v5.1 라운드에는 20개 조직이 참여하여 12개의 서로 다른 하드웨어 가속기를 탑재한 65개의 고유한 시스템을 제출했습니다. AMD는 새로운 Instinct MI355X 및 MI350X GPU를 선보였으며, AMD는 단일 노드 접근성을 위해 설계된 새로운 Llama 3.1 8B 벤치마크 개발을 주도했습니다. AMD에 따르면, MI355X GPU 성능은 Llama 3.1 8B 테스트에서 NVIDIA의 Blackwell 플랫폼 대비 5-6% 이내의 차이를 보였습니다.​

전체 제출물의 거의 절반이 멀티 노드 구성이었으며, 이는 전년도 라운드 대비 86% 증가한 수치입니다. Datacrunch, University of Florida, Wiwynn이 처음으로 참여했으며, Dell, HPE, Lenovo와 같은 기존 참가자들도 함께했습니다.​

벤치마크 업데이트에서는 레거시 테스트를 최신 AI 워크로드로 대체했습니다: 언어 모델의 경우 BERT를 Llama 3.1 8B로, 이미지 생성의 경우 Stable Diffusion v2를 FLUX.1로 교체했습니다.

댓글 0
전체 1,366 / 69 페이지
WeRide는월요일3분기매출이전년대비144%증가했다고보고했으며,이는로보택시사업의폭발적인성장과8개국에걸친글로벌확장에힘입은것으로,시간외거래에서주가가거의10%상승했다.​이자율주행회사는3분기매출2,400만달러를기록했으며,이는작년같은기간의985만달러에서증가한수치로,로보택시매출이761%급증하여500만달러를달성했다.로보택시사업은현재전체매출의21%를차지하며,이는1년전단6%에서급격히증가한것이다.매출총이익률은전년분기7%에서33%로확대되었으며,회사는순손실을71%줄여4,330만달러로축소했다.​글로벌확장이중요한이정표에도달하다WeRide는10월아부다비에서완전무인상업허가를획득하여안전운전자없이운영할수있게되었으며,UAE수도에서단위경제성손익분기점달성을위한입지를확보했습니다.현재이회사는스위스,중국,UAE,사우디아라비아,싱가포르,프랑스,벨기에,미국등8개국에서허가를받아자율주행차량을운영하고있으며,이러한글로벌규제승인을받은유일한기술기업입니다.​11월에WeRide는스위스최초의무인로보택시허가를받아460개정거장이있는110킬로미터지역에서운영할수있는권한을부여받았으며,2026년상반기를목표로완전무인공공서비스를시작할예정입니다.또한이회사는아부다비와사우디아라비아모두에서플랫폼을통해운영을시작했습니다.​함대확장및시장지위10월31일기준,WeRide는약750대의로보택시를포함하여1,600대가넘는자율주행차량을운영했으며,2030년까지중동에서수만대규모로확대할계획입니다.이회사는11월홍콩이중1차상장을완료하여약23억9천만홍콩달러를조달했으며,9월30일기준6억3,160만달러의현금을보유하고있습니다.​WeRide의창립자겸CEO인TonyHan은"우리는여러중요한이정표를달성했으며,특히아부다비에서완전무인상업용로보택시허가를확보한것이가장주목할만합니다.그곳에서의운영은곧단위경제성손익분기점에도달할예정이며,이는대규모수익성으로가는우리의길을검증하는중요한이정표입니다"라고말했습니다.
696 조회
0 추천
2025.11.25 등록
조지타운 대학교의 컴퓨터 과학자 칼 뉴포트는 2025년 11월 24일자 팟캐스트에서, 생물학자 브렛 와인스타인이 조 로건 팟캐스트에서 언급한 것과 같은 AI 의식에 대한 대중적 주장들이 대형 언어 모델의 작동 방식을 근본적으로 오해하고 있으며, 인상적인 언어 처리 능력을 의식, 의도, 조작과 같은 이 시스템들이 가질 수 없는 특성과 혼동하고 있다고 주장합니다.뉴포트는 대형 언어 모델(LLM)이 훈련이 끝나면 분산된 GPU에서 순차적인 행렬 곱셈을 통해 처리되는 고정된 숫자표로 작동한다고 설명합니다. 이들은 학습하거나, 의도를 형성하거나, 실험을 수행하거나, 이해를 갱신하지 못하며, 인간의 의식에 필요한 역동적이고 다중 시스템적 구조와는 다르다고 말합니다.“AI의 대부”로 불리는 제프리 힌턴도 와인스타인과 비슷하게 들리는 경고를 한 적이 있지만, 뉴포트는 힌턴이 아직 개발되지 않은 가상의 미래 AI 시스템에 대해 우려하고 있는 반면, 2025년이 “AI 에이전트의 해”가 될 것이라는 예상이 실패한 주요 원인은 언어 모델이 신뢰할 만한 자율적 운영에 필요한 세계 모델링, 계획, 추론 능력이 부족하기 때문이라고 명확하게 설명합니다.
702 조회
0 추천
2025.11.24 등록
일본은 최소 120억 달러를 스타트업 **라피더스(Rapidus)**에 투자하여 우유 농장과 스키 리조트로 유명한 섬 홋카이도를 최첨단 반도체 제조 허브인 “홋카이도 밸리“로 탈바꿈시키려 하고 있습니다. 이를 통해 국가의 반도체 산업을 부흥시키고, 전 세계 6천억 달러 규모의 시장에서 경쟁력을 갖추고자 하는 목표를 가지고 있습니다.라피더스는 IBM과의 협력을 통해 2나노미터 트랜지스터 시제품 생산에 성공하여, 이 능력을 가진 TSMC와 삼성과 어깨를 나란히 하게 되었습니다. 하지만, 분석가들은 라피더스가 제조 경험 부족과 318억 달러에 이르는 자금 격차를 고려할 때 2027년까지 양산에 성공할 수 있을지에 대해 의문을 제기하고 있습니다.일본의 반도체 시장 점유율은 1980년대 50% 이상에서 오늘날 약 **10%**로 급감했는데, 이는 미일 무역 갈등의 영향이 컸습니다. 이제 일본은 2025년까지 전 세계 7천억 달러 매출이 예상되는 반도체 산업에서 입지를 되찾기 위해 4만 명에 달하는 반도체 엔지니어 부족 사태에 직면해 있습니다.[
698 조회
0 추천
2025.11.24 등록
중국의 선도적인 메모리 칩 제조업체인 ChangXin Memory Technologies(CXMT)는 일요일 베이징에서 열린 중국 국제 반도체 박람회에서 새로운 세대의 DDR5 DRAM 제품을 공개하며, 고성능 AI 메모리 시장에서 삼성전자, SK하이닉스, 마이크론 테크놀로지에 직접적인 도전장을 내밀었다.새로운 DDR5 제품은 초당 최대 8,000메가비트의 속도와 최대 24기가비트의 다이 용량을 달성하여, 글로벌 경쟁업체들의 고급 제품 사양과 동등한 수준을 보인다. CXMT의 제품 라인업은 데스크톱용 UDIMM, 노트북용 SODIMM, 데이터 센터용 MRDIMM 등 7가지 주요 모듈 유형을 포함하며, AI 컴퓨팅 서버 및 고성능 애플리케이션을 목표로 한다.공급 부족 속 시장 타이밍TrendForce에 따르면 9월 초 이후 글로벌 DDR5 가격이 307% 급등한 가운데 이번 발표가 나왔다. 삼성은 32기가바이트 DDR5 모듈의 계약 가격을 9월 149달러에서 11월 239달러로 인상했는데, 이는 주요 생산업체들이 AI 애플리케이션용 고대역폭 메모리로 생산능력을 전환하면서 공급이 부족해진 것을 반영한다. 메모리 부족으로 인해 기존 소비자 전자제품 제조업체들은 AI 데이터센터 운영업체들이 프리미엄 가격을 지불하는 가운데 제한된 재고를 확보하기 위해 경쟁해야 하는 상황이다.CXMT는 또한 8,533Mbps에서 10,667Mbps에 이르는 속도의 LPDDR5X 모바일 메모리 시리즈를 선보였다. 이 회사는 5월에 8,533Mbps 및 9,600Mbps 제품의 양산을 시작했으며, 가장 빠른 10,667Mbps 버전은 여전히 고객 샘플링 단계에 있다. 이러한 제품들은 LPDDR5 대비 66%의 속도 향상을 나타내면서 전력 소비는 30% 감소시켰다.중국의 자급자족 추진이번 제품 출시는 미국의 첨단 칩 기술에 대한 수출 규제가 지속되는 가운데 반도체 자립을 달성하기 위한 중국의 강화된 노력을 보여줍니다. Counterpoint Research에 따르면, CXMT의 글로벌 DRAM 시장 점유율은 2025년 7%에서 2027년까지 10%로 증가할 것으로 예상됩니다. 현재 SK하이닉스가 38.7%의 매출 점유율로 DRAM 시장을 선도하고 있으며, 삼성이 32.7%, 마이크론이 22%로 그 뒤를 따르고 있습니다.업계 분석가들은 2026년 글로벌 DRAM 생산량이 20% 이상 증가할 것으로 예상하며, 중국의 국가 지원 반도체 이니셔티브가 계속됨에 따라 CXMT가 예상을 초과할 가능성이 있습니다. 로이터는 CXMT가 빠르면 2026년 1분기에 상하이에서 기업공개를 준비하고 있으며, 최대 3,000억 위안(420억 달러)의 기업가치를 목표로 하고 있다고 보도했습니다.
708 조회
0 추천
2025.11.24 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입