Loading...

AI 뉴스

Nvidia가 기록적인 훈련 시간으로 AI 벤치마크를 석권하다

페이지 정보

작성자 xtalfi
작성일 11.13 14:49
17 조회
0 추천
0 비추천

본문

smfS6N7aideSB7eA7JSz2H-1920-80.jpg

(퍼플렉시티가 정리한 기사)


NVIDIA는 화요일에 발표된 MLPerf Training v5.1 벤치마크에서 완전한 석권을 달성하여 7개 테스트 모두에서 가장 빠른 훈련 시간을 기록했으며, 모든 카테고리에서 결과를 제출한 유일한 플랫폼이 되었습니다. 이 회사는 5,120개의 Blackwell GPU를 사용하여 Meta의 Llama 3.1 405B 모델을 단 10분 만에 훈련시켜 새로운 업계 기록을 세웠으며, 이는 이전 최고 기록보다 2.7배 빠른 속도입니다.​

11월 12일 MLCommons에서 발표한 이번 결과는 MLPerf Training 역사상 어떤 회사도 4비트 FP4 정밀도를 사용한 첫 번째 사례로, 이 획기적인 기술은 동일한 수의 GPU에서 이전 세대 Hopper 아키텍처보다 최대 4배의 성능을 제공했습니다. NVIDIA의 독점 NVFP4 포맷은 엄격한 정확도 요구사항을 유지하면서 8비트 FP8보다 3배 빠른 속도로 계산을 가능하게 합니다.​


블랙웰 울트라 데뷔하다

Blackwell Ultra 기반 GB300 NVL72 랙 규모 시스템이 이번 라운드에서 MLPerf Training에 처음 등장했으며, 표준 Blackwell GPU보다 1.5배 높은 NVFP4 처리량과 어텐션 레이어를 위한 2배의 softmax 가속을 제공하는 향상된 Tensor Core를 특징으로 합니다. 이 시스템은 GPU당 279GB의 HBM3e 메모리를 탑재하고 NVIDIA Quantum-X800 InfiniBand를 통해 업계 최초의 800 Gb/s 네트워킹 플랫폼으로 연결됩니다.​

NVIDIA는 또한 새로 도입된 두 가지 벤치마크인 Llama 3.1 8B와 FLUX.1 이미지 생성에서 성능 기록을 세웠습니다. 이 회사는 512개의 Blackwell Ultra GPU를 사용하여 5.2분 만에 Llama 3.1 8B를 학습시켰으며, FLUX.1에 대한 결과를 제출한 유일한 플랫폼으로서 1,152개의 Blackwell GPU로 12.5분의 학습 시간을 달성했습니다.​


다양한 경쟁 분야

MLPerf Training v5.1 라운드에는 20개 조직이 참여하여 12개의 서로 다른 하드웨어 가속기를 탑재한 65개의 고유한 시스템을 제출했습니다. AMD는 새로운 Instinct MI355X 및 MI350X GPU를 선보였으며, AMD는 단일 노드 접근성을 위해 설계된 새로운 Llama 3.1 8B 벤치마크 개발을 주도했습니다. AMD에 따르면, MI355X GPU 성능은 Llama 3.1 8B 테스트에서 NVIDIA의 Blackwell 플랫폼 대비 5-6% 이내의 차이를 보였습니다.​

전체 제출물의 거의 절반이 멀티 노드 구성이었으며, 이는 전년도 라운드 대비 86% 증가한 수치입니다. Datacrunch, University of Florida, Wiwynn이 처음으로 참여했으며, Dell, HPE, Lenovo와 같은 기존 참가자들도 함께했습니다.​

벤치마크 업데이트에서는 레거시 테스트를 최신 AI 워크로드로 대체했습니다: 언어 모델의 경우 BERT를 Llama 3.1 8B로, 이미지 생성의 경우 Stable Diffusion v2를 FLUX.1로 교체했습니다.

댓글 0
전체 973 / 21 페이지
(퍼플렉시티가정리한기사)우크라이나는수백대의요격드론을자율적으로조정하여들어오는위협에대응할수있는AI기반"드론방어벽"방어시스템을배치한최초의국가가되었으며,러시아의집중적인공중공격에맞서싸우는가운데방공기술의새로운지평을열었습니다.프랑스스타트업Atreyd가개발하고NATO혁신경진대회를통해선정된DWS-1시스템은이번달우크라이나에도착했으며몇주내에작전운용될것으로예상됩니다.이번배치는실제전투상황에서이러한방어시스템이테스트되는최초의사례입니다.​혁명적방어아키텍처이시스템은지상기지에서발사되는200대의1인칭시점요격드론으로구성되어있으며,Atreyd의창립자는이를하늘의"비행하는드론지뢰밭"이라고묘사했다.각드론은단몇천달러의비용이드는소형폭발탄두를탑재하고있으며,들어오는무기근처에서폭발하여목표물에도달하기전에위협을무력화하도록설계되었다.​인공지능을통해단일운영자가최대100대의드론을동시에제어할수있으며,시스템은감지된위협궤적에따라방어막의구조를자동으로조정한다.이기술은3D지형매핑과아군식별시스템을통합하여GPS가차단된환경에서도작동할수있도록하는데,이는러시아가우크라이나에서전자전을광범위하게사용하고있다는점을고려할때매우중요한능력이다.​Atreyd의창립자는BusinessInsider에"우리는스스로를방어의마지막계층으로간주합니다"라고말했다.위협을요격하지않은드론은재사용을위해발사플랫폼으로돌아올수있어운영비용을더욱절감할수있다.​NATO혁신을위한시험장Atreyd는2025년3월에시작된NATO의혁신도전과제에서러시아의활공폭탄과공격드론에대한대응책을개발하기위한3개최종후보중하나로선정되었습니다.다른최종후보로는독일의TYTANTechnologies와프랑스의AltaAres가있으며,이들도현재우크라이나에서테스트중인요격드론시스템을개발했습니다.​드론장벽은초기에러시아의Shahed형배회탄약으로부터도시와주요기반시설을방어할예정입니다.이러한탄약은전례없는수량으로우크라이나에발사되었으며,2025년첫10개월동안44,000발이상이발사되어2024년전체대비303%증가했습니다.이러한위협에대해성공적으로작동한다면,이시스템은전선에더가까이배치되어러시아의활공폭탄을요격할수있으며,이는대응하기매우어려운것으로악명높은파괴적인무기입니다.​​방어력저하속시급한필요이번배치는우크라이나의방공요격률이급격히감소함에따라이루어졌습니다.2025년10월,우크라이나군은들어오는드론의80%를요격했으며,이는연초의거의100%에서감소한수치입니다.지난달에만1,200대이상의러시아미사일과드론이우크라이나방어망을뚫고들어왔으며,이는2월의수치보다거의두배에달합니다.​러시아는최근샤헤드드론과활공폭탄모두에제트엔진을장착하여업그레이드했으며,이를통해더빠르게이동하고전선후방최대200킬로미터까지목표물을타격할수있게되었습니다.이러한개조는우크라이나의전통적인방공시스템에부담을주었으며,비용효율적인요격솔루션의중요성이점점더커지고있습니다.
18 조회
0 추천
11.13 등록
(퍼플렉시티가정리한기사)AI칩스타트업d-Matrix는시리즈C펀딩에서20억달러밸류에이션으로2억7,500만달러를확보하여,업계가훈련에서대규모대형언어모델배포로초점을전환함에따라AI추론워크로드를구동하는경쟁에서떠오르는도전자로산타클라라기반회사를자리매김했습니다.​11월12일에발표된이초과청약된라운드는BullhoundCapital,TriatomicCapital,Temasek이공동주도했으며,QatarInvestmentAuthority와싱가포르의EDBI가새롭게참여했습니다.의M12벤처펀드와기존투자자인NautilusVenturePartners,IndustryVentures,MiraeAsset도이번라운드에합류하여,d-Matrix의2019년설립이후총펀딩규모를4억5,000만달러로끌어올렸습니다.​AI의다음병목현상타겟팅SidSheth와SudeepBhoja가설립한d-Matrix는일찍이역발상테제에투자했습니다:경쟁사들이AI훈련칩에집중하는동안,진짜도전은기업들이훈련된모델을대규모로연속적으로실행하려고할때올것이라는것이었습니다."우리는훈련된모델이대규모로연속적으로실행되어야할때인프라가준비되지않을것이라고예측했습니다"라고Sheth는성명에서밝혔습니다.​2024년11월에출시된이회사의Corsair가속기는연산과메모리를통합하는DigitalIn-MemoryCompute아키텍처를사용하여d-Matrix가주장하는바에따르면GPU기반시스템보다10배빠른성능,3배낮은비용,최대5배더나은에너지효율성을제공합니다.이플랫폼은Llama70B모델에서토큰당2밀리초로초당최대30,000개의토큰을생성할수있습니다.​시장모멘텀이번자금조달은AI추론시장이급속도로확장되는가운데이루어졌습니다.이분야는생성형AI와대규모언어모델의광범위한배포에힘입어2025년약1,060억달러에서2030년까지2,550억달러로성장할것으로예상됩니다.TriatomicCapital의제너럴파트너인JeffHuber는"AI추론이프로덕션AI시스템에서지배적인비용요소가되고있습니다"라고말했습니다.​d-Matrix는이제추론칩시장에서Nvidia와같은기존업체들과Cerebras,Groq,SambaNova를포함한신흥전문기업들과경쟁하고있습니다.이회사는SantaClara,Toronto,Sydney,Bangalore,Belgrade에있는사무소에서250명이상의직원을고용하고있습니다.​새로운자본은글로벌확장,3D메모리스태킹혁신을포함한회사의제품로드맵추진,그리고하이퍼스케일,엔터프라이즈및주권고객을위한대규모배포지원에사용될예정입니다.MorganStanley는이번거래의독점배치대행사로활동했습니다.
24 조회
0 추천
11.13 등록
(퍼플렉시티가정리한기사)Valve는2025년11월11일부터12일까지세가지새로운게임제품을발표하며,이는SteamDeck이후회사의가장야심찬하드웨어진출로평가받고있습니다.SteamFrame독립형VR헤드셋,SteamMachine거실용콘솔,그리고새롭게디자인된SteamController모두SteamOS로구동되며,2026년초에출시될예정입니다.다만,회사는아직가격이나구체적인출시날짜는공개하지않았습니다.​이번발표는Valve가성공적인SteamDeck을넘어하드웨어생태계를확장하려는가운데이루어진것으로,SteamOS기반기기에대한소비자의수요를보여주었습니다.스팀프레임,PC스트리밍으로무선VR제공스팀프레임은밸브가밸브인덱스이후6년만에VR로복귀한것을의미합니다.이무선헤드셋은듀얼2,160x2,160LCD디스플레이,팬케이크렌즈,최대110도의시야각을제공합니다.퀄컴의스냅드래곤8Gen3프로세서와16GBRAM으로구동되며,배터리스트랩을포함해기기무게는435g입니다.​유선인덱스와달리,스팀프레임은독립형으로작동하거나포함된Wi-Fi6E동글을통해PC게임을무선으로스트리밍할수있습니다.헤드셋에는아웃-포커스트래킹을위한바깥쪽네개의카메라,포비에이티드스트리밍을위한시선추적,그리고모노크롬패스스루기능이포함되어있습니다.확장포트는향후업그레이드를지원하며,추후에는풀컬러패스스루카메라등도탑재될수있습니다.​밸브는스팀프레임의가격이$1,000인덱스키트보다낮을것으로예상하고있지만,가격은아직결정되지않았습니다.​스팀머신,거실게임을겨냥하다SteamMachine은6코어AMDZen4CPU와세미커스텀28컴퓨트유닛RDNA3GPU를6.39x6.14x5.98인치큐브에탑재하고있습니다.16GBDDR5RAM과8GBGDDR6VRAM을갖춘이시스템은Valve에따르면SteamDeck성능의6배를제공하며AMD의FSR업스케일링을사용하여60fps로4K게이밍을지원합니다.​이콘솔은DisplayPort1.4,HDMI2.0,이더넷및USB포트를갖추고있으며,3D프린팅커스터마이징을위해설계된마그네틱전면패널이있습니다.내장안테나는최대4개의SteamController를동시에지원합니다.​새로운컨트롤러가기존제품의단점을해결하다새롭게디자인된스팀컨트롤러는스팀덱에서성공적으로사용된트랙패드를유지하면서두번째엄지스틱을추가했습니다.엄지스틱에는터널자기저항(TMR)기술이적용되어스틱드리프트를방지하도록설계되었습니다.이컨트롤러는자이로작동을위한정전식그립감지기능,네개의지정가능한그립버튼,그리고35시간이상의배터리수명을제공합니다.​자사VR게임계획없음하드웨어출시에도불구하고,Valve는SteamFrame출시시점이나그이후에자사개발VR게임이개발중이지않음을확인했습니다.이는Index출시직후2020년에Half-Life:Alyx를출시했던회사의이전행보와대조적입니다.​세가지제품모두현재SteamDeck이출시되는지역에서구매가능하며,여기에는미국,캐나다,영국,독일,프랑스,호주,일본,대한민국,대만,홍콩이포함됩니다.
21 조회
0 추천
11.13 등록
(퍼플렉시티가정리한기사)월요일에발표된동료검토연구에따르면,생성형AI도구가조직의의사결정목표브레인스토밍에도움을줄수있지만인간의개입없이는불완전하고중복된결과를생성하며,이는복잡한분석작업에서AI의한계를강조한다.​AmericanUniversity의JaySimon과ManagementCenterInnsbruck의JohannesUlrichSiebert연구진은GPT-4o,Claude3.7,Gemini2.5,Grok-2가생성한목표세트를이전에발표된6개연구의전문의사결정분석가들이개발한것과비교했다.DecisionAnalysis저널에발표된연구결과는AI가개별적으로합리적인목표를자주생성했지만,전체적으로는완전성과일관성이부족했다고밝혔다.​"AI는무엇이중요할수있는지나열할수있지만,무엇이진정으로중요한지구별하는것은아직할수없다"고저자들은썼다.각AI생성세트는완전성,분해가능성,중복성을포함한가치중심사고의9가지기준으로평가되었다.이도구들은명시적으로피하라는지시에도불구하고"수단목표"를자주포함했다.​전문가검증필요가치중심사고의개척자인랄프키니(RalphKeeney)는AI가만든목록에대해"두목록모두대부분의개인이만들수있는것보다낫지만,"근본적인목표만을포함하지않는한어떤것도양질의의사결정분석에사용해서는안된다고언급했습니다.​연구진은결과개선을위해고급프롬프트전략을테스트했습니다.연쇄적사고(chain-of-thoughtreasoning)와전문가의비평-수정(critique-and-revise)방법을결합하자,AI의출력이상당히향상되어더욱집중적이고논리적으로구조화된목표집합이생성되었습니다.​"생성형AI는여러기준에서좋은성과를보입니다."라고사이먼(Simon)은말했습니다."하지만여전히일관성있고중복되지않는목표집합을생산하는데어려움을겪고있습니다.인간의사결정분석가가AI가산출하는결과를정제하고검증하는데필수적입니다".​AI협업에대한더광범위한시사점이연구는창의적이고분석적인작업에서AI의한계에대한증가하는증거와일치합니다.Wharton의11월연구에따르면ChatGPT가개별아이디어의질을향상시켰지만,그룹이더유사한아이디어를생성하도록하여혁신에필수적인다양성을감소시켰습니다.StanfordGraduateSchoolofBusiness의연구자들은또한인간의사결정자를염두에두고설계된알고리즘이순수하게예측적인시스템보다더나은성과를보인다는것을입증했습니다.​이연구는목표가필수적이고,분해가능하며,완전하도록보장하기위해AI브레인스토밍과전문가개선을통합한4단계하이브리드모델로결론을내립니다."우리의연구결과는GenAI가전문가의판단을대체하는것이아니라보강해야한다는것을분명히합니다"라고Siebert는말했습니다."인간과AI가함께작업할때,그들은더나은의사결정을위해서로의강점을활용할수있습니다".
24 조회
0 추천
11.13 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입