AI 뉴스

Nvidia가 기록적인 훈련 시간으로 AI 벤치마크를 석권하다

페이지 정보

작성자 xtalfi
작성일 2025.11.13 14:49
950 조회
0 추천
0 비추천

본문

smfS6N7aideSB7eA7JSz2H-1920-80.jpg

(퍼플렉시티가 정리한 기사)


NVIDIA는 화요일에 발표된 MLPerf Training v5.1 벤치마크에서 완전한 석권을 달성하여 7개 테스트 모두에서 가장 빠른 훈련 시간을 기록했으며, 모든 카테고리에서 결과를 제출한 유일한 플랫폼이 되었습니다. 이 회사는 5,120개의 Blackwell GPU를 사용하여 Meta의 Llama 3.1 405B 모델을 단 10분 만에 훈련시켜 새로운 업계 기록을 세웠으며, 이는 이전 최고 기록보다 2.7배 빠른 속도입니다.​

11월 12일 MLCommons에서 발표한 이번 결과는 MLPerf Training 역사상 어떤 회사도 4비트 FP4 정밀도를 사용한 첫 번째 사례로, 이 획기적인 기술은 동일한 수의 GPU에서 이전 세대 Hopper 아키텍처보다 최대 4배의 성능을 제공했습니다. NVIDIA의 독점 NVFP4 포맷은 엄격한 정확도 요구사항을 유지하면서 8비트 FP8보다 3배 빠른 속도로 계산을 가능하게 합니다.​


블랙웰 울트라 데뷔하다

Blackwell Ultra 기반 GB300 NVL72 랙 규모 시스템이 이번 라운드에서 MLPerf Training에 처음 등장했으며, 표준 Blackwell GPU보다 1.5배 높은 NVFP4 처리량과 어텐션 레이어를 위한 2배의 softmax 가속을 제공하는 향상된 Tensor Core를 특징으로 합니다. 이 시스템은 GPU당 279GB의 HBM3e 메모리를 탑재하고 NVIDIA Quantum-X800 InfiniBand를 통해 업계 최초의 800 Gb/s 네트워킹 플랫폼으로 연결됩니다.​

NVIDIA는 또한 새로 도입된 두 가지 벤치마크인 Llama 3.1 8B와 FLUX.1 이미지 생성에서 성능 기록을 세웠습니다. 이 회사는 512개의 Blackwell Ultra GPU를 사용하여 5.2분 만에 Llama 3.1 8B를 학습시켰으며, FLUX.1에 대한 결과를 제출한 유일한 플랫폼으로서 1,152개의 Blackwell GPU로 12.5분의 학습 시간을 달성했습니다.​


다양한 경쟁 분야

MLPerf Training v5.1 라운드에는 20개 조직이 참여하여 12개의 서로 다른 하드웨어 가속기를 탑재한 65개의 고유한 시스템을 제출했습니다. AMD는 새로운 Instinct MI355X 및 MI350X GPU를 선보였으며, AMD는 단일 노드 접근성을 위해 설계된 새로운 Llama 3.1 8B 벤치마크 개발을 주도했습니다. AMD에 따르면, MI355X GPU 성능은 Llama 3.1 8B 테스트에서 NVIDIA의 Blackwell 플랫폼 대비 5-6% 이내의 차이를 보였습니다.​

전체 제출물의 거의 절반이 멀티 노드 구성이었으며, 이는 전년도 라운드 대비 86% 증가한 수치입니다. Datacrunch, University of Florida, Wiwynn이 처음으로 참여했으며, Dell, HPE, Lenovo와 같은 기존 참가자들도 함께했습니다.​

벤치마크 업데이트에서는 레거시 테스트를 최신 AI 워크로드로 대체했습니다: 언어 모델의 경우 BERT를 Llama 3.1 8B로, 이미지 생성의 경우 Stable Diffusion v2를 FLUX.1로 교체했습니다.

댓글 0
전체 1,366 / 111 페이지
(퍼플렉시티가정리한기사)인공지능코딩도우미는소프트웨어엔지니어들이업무에접근하는방식을근본적으로재편하고있지만,많은사람들이예상했던방식과는다릅니다.11월15일TechRadar에기고한Chronosphere의CTO이자공동창립자인RobSkillington에따르면,AI는워크플로우이상을변화시키고있으며,커리어경로를바꾸고개발자들이자신의역할을완전히재정의하도록강요하고있습니다.​비영리AI연구그룹METR의최근무작위대조시험에서는AI도구를사용하는숙련된오픈소스개발자들이AI지원없이작업할때보다실제로작업완료에19%더오래걸린다는것을발견했습니다.이는참가자와전문가모두약40%의속도향상을예측했던연구전기대와모순됩니다.​METR연구원들에따르면,속도저하는개발자들이AI에프롬프트를입력하고,생성된제안을검토하고,복잡한코드베이스와출력물을통합하는데시간을소비하는데서비롯됩니다.실패율중60%는AI도구로인해발생하며,여기에는처음에는수용가능해보이지만면밀히검토하면상당한수정이필요한"버그가있는"코드가포함됩니다.​순환적디버깅문제AI코딩에이전트는코드작성시추가적인아이디어레이어를제공하지만,종종자신의코드를수정하려는순환적시도에갇히곤합니다.이는특히AI가어려움을겪는코드를수정하고재구현할때,전문화된코드베이스나비정형적인맥락에서작업할때더높은수준의지도가필요합니다.​이러한어려움에도불구하고,AI코딩에이전트는개선되고있습니다.최신도구들은이제자신이작성한코드에대해테스트를빌드하고실행하며자체적으로오류를수정하여,기술초기단계에비해환각(hallucination)문제가덜한편입니다.​MCP서버를통한DevOps혁신떠오르는밝은영역중하나는사이트신뢰성엔지니어링입니다.Cursor및ClaudeCode와같은AI코딩도구와통합되는ModelContextProtocol서버를사용함으로써엔지니어들은일상적인DevOps워크플로우에AI를쉽게통합할수있습니다.MCP서버는텔레메트리데이터를AI에제공하여AI가데이터를분석하고수동입력을제거할수있게하며,이는효율성을향상시키고환각을줄입니다.​이를통해사이트신뢰성엔지니어들은몰입상태를유지하면서서비스수준목표의상태를신속하게평가하고,로그를수집하며,서비스의오류및지연시간분포를관찰할수있습니다.업계보고서에따르면,이러한통합은일부팀이사고해결시간을몇시간에서몇분으로단축하는데도움이되었습니다.​AI가시간을절약하는지낭비하는지는작업의복잡성,엔지니어의경험수준,그리고AI를효과적으로프롬프트하는능력에달려있습니다.Skillington이언급했듯이,궁극적으로"인간이지원하는AI가가장강력한AI가될것"입니다.
931 조회
0 추천
2025.11.17 등록
(퍼플렉시티가정리한기사)일본의연구자들이1,000억개이상의개별별들을추적하는최초의은하수은하시뮬레이션을달성했으며,이는인공지능과슈퍼컴퓨팅능력을결합하여이룬성과입니다.이번주세인트루이스에서열린SC'25슈퍼컴퓨팅컨퍼런스에서발표된이시뮬레이션은10,000년의은하진화를모델링하며이전방법보다100배빠르게실행됩니다.​RIKEN학제간이론및수리과학센터의KeiyaHirashima가이끄는일본과스페인의국제팀은천체물리학자들을오랫동안좌절시켜온문제를해결했습니다:초신성폭발과같은빠른항성현상을포착하면서전체은하를정확하게시뮬레이션하는것.​계산장벽돌파하기이전의최첨단시뮬레이션은대략10억개의태양질량에해당하는은하를처리할수있었는데,이는우리은하의실제항성개체군보다100배작은규모였습니다.기존의물리기반접근방식으로는은하진화의백만년마다315시간이소요되었으며,이는10억년시뮬레이션을완료하는데36년이상이걸린다는것을의미했습니다.​돌파구는고해상도초신성시뮬레이션으로훈련된딥러닝대리모델을통해마련되었습니다.이AI구성요소는초신성폭발이후10만년동안가스가팽창하는방식을예측하는방법을학습하여,정확도를유지하면서계산비용이많이드는작은타임스텝을우회할수있게했습니다.RIKEN의Fugaku슈퍼컴퓨터와도쿄대학교의Miyabi시스템에걸쳐700만개의CPU코어를사용하여,연구팀은시뮬레이션시간을백만년당단2.78시간으로단축했으며,이를통해10억년예측을약115일만에가능하게했습니다.​별너머의영향들Hirashima에따르면,이방법론은천체물리학을훨씬넘어서는범위로확장된다."AI와고성능컴퓨팅의통합은계산과학전반에걸쳐다중스케일,다중물리문제를해결하는방식의근본적인변화를나타냅니다"라고그는말하며,기후모델링,기상예측,해양학과같이소규모프로세스와대규모프로세스를연결하는것이유사한계산과제를제기하는분야에서의응용을언급했다.​이시뮬레이션은연구자들이생명에필수적인원소들이은하내에서어떻게출현했는지추적할수있게하며,지구와같은행성을가능하게만든화학적진화를잠재적으로조명한다.
866 조회
0 추천
2025.11.17 등록
(퍼플렉시티가정리한기사)무협액션RPG《WhereWindsMeet》는11월14일글로벌출시후24시간만에163,523명의동시접속자를기록하며Steam을강타했지만,AI챗봇NPC사용이투명성과게임개발에서인공지능의역할에대한열띤논쟁을불러일으켰다.​EverstoneStudio와NetEaseGames의무료플레이게임은플레이어가텍스트입력또는음성입력을통해AI기반챗봇으로특정NPC와대화할수있는"강호친구(JianghuFriends)"시스템을제공한다.이러한AI상호작용은게임내에서표시되지만,Steam스토어페이지에는해당기술이공개되지않았으며,이는소셜미디어플랫폼에서비판을촉발시킨사실이다.​플레이어반응은재미와우려사이에서갈리다출시이후,플레이어들은AINPC를조종하여게임의역사적배경을무너뜨리는터무니없는대화를나눌수있다는것을발견했습니다.Reddit유저MisterZan25는NPC조다리(ZhaoDali)에게자신의캐릭터가그의아이를임신했다고설득하여양육비를요구한다음,아이가죽었다고주장한일화를게시했습니다.다른유저인Immediate-Molasses-5는같은NPC에게케첩과감자로요리하는것에대해물어봤고,AI는"송나라시대에는케첩을구할수없었다"고인정하는답변을했습니다.​"WhereWindsMeet을다운로드하려고했는데AI챗봇NPC에대해알게됐어요,"Bluesky유저rynegaia가토요일에작성했습니다."우리는지옥에있군요".​다른사람들은이기능에대해재미있어했습니다.한플레이어는"술취한남자와랩을하느라너무많은시간을보낸것을즐겁게인정했고,"다른플레이어는"요리사를비건으로만들려고시도했으며""나무꾼을위한광고전략을개발했다"고PCGamesN이보도했습니다.​투명성과윤리적우려Steam스토어페이지의공개부족이핵심비판으로떠올랐습니다."게임플레이에크게해롭지는않지만(이러한종류의NPC를완전히피할수있음)WhereWindsMeet에AI챗봇을포함시킨것은궁극적으로실제인간의작업가치를떨어뜨리는AI지원게임개발노력을정상화하려는지속적인시도를나타냅니다"라고PCGamesN이보도했습니다.​논란에도불구하고,이게임은출시후첫12시간동안"복합적"평가에서상승한후Steam에서"대체로긍정적"평가를유지하고있습니다.이타이틀은11월16일에193,860명의동시접속자최고치를기록했으며,무료플레이출시치고는강력한유지율을보여주고있습니다.​NetEaseGames는Steam스토어공개나AI구현에대한논평요청에즉시응답하지않았습니다.
808 조회
0 추천
2025.11.17 등록
(퍼플렉시티가정리한기사)삼성전자는일요일인공지능붐으로인한급증하는수요를충족하기위해한국평택공장에칩생산라인을추가할것이라고확인했으며,2028년부터양산을시작할예정이다.​세계최대반도체생산단지의일부인새로운P5공장은스마트폰과PC칩에대한수요가둔화되면서2023년말부터지연되어왔다.그러나이제AI시대가본격화되면서삼성은메모리반도체의장기적성장이예상됨에따라생산능력을미리확보하기위해확장을가속화하고있다고회사는성명에서밝혔다.​기록적인수익이확장계획을주도하다이번발표는삼성의반도체사업이HBM3E메모리칩과서버SSD의강력한판매에힘입어2025년3분기분기사상최대매출을기록한가운데나왔다.7-9월기간영업이익은전년동기대비32.5%급증한12조1600억원(85억달러)을기록하며시장전망치를상회했다.​삼성전자는"글로벌AI시대가본격화됨에따라메모리반도체수요가중장기적으로확대될것으로예상한다"고밝혔다.새로운메모리칩공장은기존서버와AI서버모두에대한수요를충족할것이라고대변인이덧붙였다.​이재용삼성회장은회사가"국내투자를늘리고,젊은이들을위한양질의일자리를창출하며,중소기업및벤처기업과의상생을위해더욱노력할것"이라고말했다.​광범위한투자전략평택확장은삼성이일요일에발표한450조원(3,100억달러)규모의5개 년투자계획의일부입니다.이투자에는AI칩시설건설,AI중심데이터센터확장,차세대배터리생산라인개발이포함됩니다.​별도로,댈러스에본사를둔개발업체가텍사스테일러에있는삼성의170억달러규모칩공장바로북동쪽의220에이커부지에대규모데이터센터캠퍼스를건설하는것을제안하고있습니다.AI칩제조를위해와165억달러규모의계약을체결한삼성의텍사스시설은2026년에가동을시작할예정입니다.​또한삼성은AI칩생산을위한글로벌경쟁이스마트폰,컴퓨터및서버에필요한반도체공급을압박함에따라특정메모리칩가격을9월대비최대60%까지인상했습니다.
814 조회
0 추천
2025.11.17 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입