Loading...

AI 뉴스

Nvidia가 기록적인 훈련 시간으로 AI 벤치마크를 석권하다

페이지 정보

작성자 xtalfi
작성일 11.13 14:49
7 조회
0 추천
0 비추천

본문

smfS6N7aideSB7eA7JSz2H-1920-80.jpg

(퍼플렉시티가 정리한 기사)


NVIDIA는 화요일에 발표된 MLPerf Training v5.1 벤치마크에서 완전한 석권을 달성하여 7개 테스트 모두에서 가장 빠른 훈련 시간을 기록했으며, 모든 카테고리에서 결과를 제출한 유일한 플랫폼이 되었습니다. 이 회사는 5,120개의 Blackwell GPU를 사용하여 Meta의 Llama 3.1 405B 모델을 단 10분 만에 훈련시켜 새로운 업계 기록을 세웠으며, 이는 이전 최고 기록보다 2.7배 빠른 속도입니다.​

11월 12일 MLCommons에서 발표한 이번 결과는 MLPerf Training 역사상 어떤 회사도 4비트 FP4 정밀도를 사용한 첫 번째 사례로, 이 획기적인 기술은 동일한 수의 GPU에서 이전 세대 Hopper 아키텍처보다 최대 4배의 성능을 제공했습니다. NVIDIA의 독점 NVFP4 포맷은 엄격한 정확도 요구사항을 유지하면서 8비트 FP8보다 3배 빠른 속도로 계산을 가능하게 합니다.​


블랙웰 울트라 데뷔하다

Blackwell Ultra 기반 GB300 NVL72 랙 규모 시스템이 이번 라운드에서 MLPerf Training에 처음 등장했으며, 표준 Blackwell GPU보다 1.5배 높은 NVFP4 처리량과 어텐션 레이어를 위한 2배의 softmax 가속을 제공하는 향상된 Tensor Core를 특징으로 합니다. 이 시스템은 GPU당 279GB의 HBM3e 메모리를 탑재하고 NVIDIA Quantum-X800 InfiniBand를 통해 업계 최초의 800 Gb/s 네트워킹 플랫폼으로 연결됩니다.​

NVIDIA는 또한 새로 도입된 두 가지 벤치마크인 Llama 3.1 8B와 FLUX.1 이미지 생성에서 성능 기록을 세웠습니다. 이 회사는 512개의 Blackwell Ultra GPU를 사용하여 5.2분 만에 Llama 3.1 8B를 학습시켰으며, FLUX.1에 대한 결과를 제출한 유일한 플랫폼으로서 1,152개의 Blackwell GPU로 12.5분의 학습 시간을 달성했습니다.​


다양한 경쟁 분야

MLPerf Training v5.1 라운드에는 20개 조직이 참여하여 12개의 서로 다른 하드웨어 가속기를 탑재한 65개의 고유한 시스템을 제출했습니다. AMD는 새로운 Instinct MI355X 및 MI350X GPU를 선보였으며, AMD는 단일 노드 접근성을 위해 설계된 새로운 Llama 3.1 8B 벤치마크 개발을 주도했습니다. AMD에 따르면, MI355X GPU 성능은 Llama 3.1 8B 테스트에서 NVIDIA의 Blackwell 플랫폼 대비 5-6% 이내의 차이를 보였습니다.​

전체 제출물의 거의 절반이 멀티 노드 구성이었으며, 이는 전년도 라운드 대비 86% 증가한 수치입니다. Datacrunch, University of Florida, Wiwynn이 처음으로 참여했으며, Dell, HPE, Lenovo와 같은 기존 참가자들도 함께했습니다.​

벤치마크 업데이트에서는 레거시 테스트를 최신 AI 워크로드로 대체했습니다: 언어 모델의 경우 BERT를 Llama 3.1 8B로, 이미지 생성의 경우 Stable Diffusion v2를 FLUX.1로 교체했습니다.

댓글 0
전체 936 / 11 페이지
(퍼플렉시티가정리한기사)OpenAI는오늘GPT-5.1을출시하며,ChatGPT를더욱대화적이고지능적으로만들고사용자에게성격에대한전례없는제어권을제공하는것을목표로하는두가지업그레이드된모델을선보였습니다.​11월12일부터유료구독자들에게배포되기시작한이번업데이트는GPT-5.1Instant와GPT-5.1Thinking을제공하며,두모델모두8월에출시된초기GPT-5를괴롭혔던사용자불만을해결하기위해설계되었습니다.OpenAI는GPT-5.1Instant가"기본적으로더따뜻하고더대화적"이라고밝혔으며,초기테스터들은이모델이"명확하고유용함을유지하면서도재미있는면으로종종사람들을놀라게한다"고언급했습니다.​이번출시는OpenAI의GPT-5출시가광범위한반발을일으킨지3개월만에이루어졌습니다.당시사용자들은모델의"더차가운"어조와GPT-4o와같은사랑받던레거시모델의갑작스러운제거를비판했습니다.OpenAICEO샘알트먼은당시GPT-4o를중단한것이"실수였다"고인정하며,회사가특정모델에대한사용자들의"감정적애착"을과소평가했다고시인했습니다.​적응적추론과더나은성능GPT-5.1Instant는적응형추론기능을도입하여모델이어려운질문에대해"답변하기전에생각할지"여부를스스로결정할수있도록합니다.OpenAI에따르면,이로인해AIME2025및Codeforces를비롯한수학및코딩벤치마크에서상당한향상이이루어졌습니다.또한,모델의지시사항준수능력도향상되었습니다.OpenAI에서제공한예시에서,정확히여섯단어로답하라는요청에GPT-5.1은정확히따르지만GPT-5는동일한테스트에서실패했습니다.​GPT-5.1의사고과정은작업의복잡성에따라처리시간을조정하며,어려운문제에는더많은시간을투자하고,더단순한질문에는더빠르게응답합니다.이제모델은"전문용어와정의되지않은용어를줄여"더명확한설명을제공하여기술업무에더욱접근하기쉬워졌습니다.​확장된개인화옵션모델업그레이드와함께OpenAI는6가지새로운성격프리셋을도입했습니다:Default,Professional,Friendly,Candid,Quirky,Efficient가기존의Nerdy및Cynical옵션에추가되었습니다.OpenAI의애플리케이션CEO인FidjiSimo는"많은사용자들이GPT-5.1이IQ와EQ를통합하는데뛰어나다는것을발견할것으로믿지만,단일기본설정으로는모든사람의선호도를수용할수없습니다"라고말했습니다.​사용자는응답간결성,따뜻함,이모지빈도를포함한세부제어기능도조정할수있습니다.OpenAI는ChatGPT가대화중에톤조정을능동적으로제안할수있는기능을테스트하고있습니다.​출시는Pro,Plus,Go,Business플랜의유료사용자부터시작되며,무료사용자는며칠내에액세스권한을얻게됩니다.두모델모두이번주후반에API를통해제공되며,GPT-5.1Instant는gpt-5.1-chat-latest로액세스할수있습니다.레거시GPT-5모델은3개월동안계속사용할수있으며,이는사전경고없이모델을폐기했던OpenAI의이전접근방식에서벗어난변화를나타냅니다.
6 조회
0 추천
11.13 등록
(퍼플렉시티가정리한기사)테슬라코리아가12일공식엑스(X,옛트위터)계정을통해완전자율주행(FSD·FullSelf-Driving)감독형서비스를한국에곧출시한다고밝혔다.테슬라가한국내FSD서비스출시계획을공식적으로밝힌것은이번이처음이다.​테슬라코리아는"FSD감독형,다음목적지:한국,곧출시(ComingSoon)"라는게시물과함께서울도심에서FSD로자율주행하는영상을공개했다.영상에는운전자가핸들에서손을떼거나가볍게올려둔채로차량이스스로차선을변경하고주차하는모습이담겼다.​아시아주요시장중최초도입테슬라의FSD는현재미국,캐나다,멕시코,중국,호주,뉴질랜드에서서비스중이다.한국은중국에이어아시아주요국가로는두번째FSD도입국이될전망이다.최근일본에서도FSD시험주행이시작됐다.​감독형FSD는차량이가속,제동,핸들링등운전결정의대부분을독자적으로수행하지만,운전자는항상전방을주시하고비상상황에서개입할준비가돼있어야한다.테슬라코리아는영상에서"감독형FSD는완전한자율주행기능이아니며모든장애물,도로,교통상황을완벽히인식하지못할수있어운전자는항상주의를유지하고즉시제어할준비가되어있어야한다"고밝혔다.​정부규제와안전성논란국토교통부는지난해부터테슬라FSD도입에대해"특별히제한을두지않겠다"는입장을밝혀왔다.올해3월에는"테슬라가자기인증제도를활용해국내에서완전자율주행기능을적용할수있다"고밝히며제도적문턱을낮췄다.​한편미국도로교통안전국(NHTSA)은지난10월부터약290만대의테슬라FSD차량을대상으로신호위반,역주행등교통법규위반의혹에대한전면조사를진행중이다.테슬라측은FSD가53억마일주행중55건의위반을기록해미국평균운전자대비200배이상안전하다고주장하고있다.​테슬라코리아는FSD옵션가격을904만원으로책정했다.기존테슬라차량중FSD용'하드웨어3.0'이상을탑재한모델은소프트웨어업그레이드를통해이용할수있다.테슬라는올해1~10월국내에서4만7962대를판매해BMW,메르세데스-벤츠에이어수입차브랜드3위를차지하고있다.
6 조회
0 추천
11.13 등록
(퍼플렉시티가정리한기사)DeductiveAI는화요일750만달러의시드펀딩을받으며스텔스모드에서벗어났으며,소프트웨어엔지니어링의가장고질적인문제중하나에대한솔루션을제시했습니다.엔지니어들이새로운제품을구축하는대신버그를찾는데거의절반의시간을소비하는문제입니다.Databricks와ThoughtSpot출신의베테랑들이설립한이마운틴뷰스타트업은게임AI시스템을구동하는것과유사한강화학습기술을사용하여몇시간이아닌몇분만에프로덕션장애를진단하는AI에이전트를배포합니다.​이번펀딩라운드는CRV가주도했으며,DatabricksVentures,ThomvestVentures,PrimeSet이참여했습니다.회사는실제사고로부터학습하여장애를자동으로감지하고,근본원인을진단하며,엔지니어가소프트웨어문제를해결하도록돕는"AISRE에이전트"를도입하고있습니다.이기능은사고해결시간을최대90퍼센트까지단축할수있다고회사는밝혔습니다.​AI가더많은코드를생성하면서증가하는문제를목표로삼다이러한시기는소프트웨어개발에서증가하는긴장감을반영합니다.AI코딩어시스턴트가엔지니어들이그어느때보다빠르게코드를작성할수있도록지원하는동안,연구에따르면개발자들은시간의30~50%를디버깅에소비하며,AI생성코드가확산되면서이수치는증가하기만했습니다.Harness의2025년보고서에따르면개발자의67%가AI생성코드를디버깅하는데더많은시간을할애하고있습니다.​DeductiveAI의공동창업자이자CEO인RakeshKothari는VentureBeat와의인터뷰에서"우리는세계적수준의엔지니어들이구축하는대신시간의절반을디버깅에소비하는것을목격했습니다"라고말했습니다."그리고바이브코딩이전례없는속도로새로운코드를생성함에따라,이문제는더욱악화될것입니다."​이회사는이미여러주목할만한고객사에서실제영향력을입증했습니다.DoorDash의광고플랫폼은Deductive를사고대응프로토콜에통합했으며,DoorDash의엔지니어링수석이사인ShahroozAnsari에따르면이시스템이최근몇달동안약100건의프로덕션사고에대한근본원인을식별했으며,이는연간1,000시간이상의생산성절감과수백만달러상당의수익영향으로환산된다고합니다.위치인텔리전스기업Foursquare에서Deductive는ApacheSpark작업실패를진단하는데필요한시간을90%단축하여수시간또는며칠에서10분미만으로줄였으며,연간275,000달러이상의비용절감효과를가져왔습니다.​기술작동방식Deductive의기술적접근방식은Datadog이나NewRelic과같은기존옵저버빌리티플랫폼에추가되는AI기능들과차별화됩니다.이시스템은코드베이스,로그,메트릭,트레이스,내부문서간의관계를매핑하는'지식그래프'를구축합니다.인시던트가발생하면여러AI에이전트가함께협력하여가설을생성하고,이를실시간시스템증거와대조하며,근본원인에수렴합니다—숙련된사이트신뢰성엔지니어가조사하는방식을모방하지만훨씬짧은시간에작업을완료합니다.​플랫폼은기존인프라와읽기전용API를통해옵저버빌리티플랫폼,코드저장소,인시던트관리도구,커뮤니케이션시스템에연결됩니다.강화학습을활용하여지속적으로개선하며,각인시던트에서어떤조사액션이정확한진단으로이어졌는지학습합니다.​공동창립자이자CTO인SameerAgarwal은UCBerkeley에서BlinkDB라는근사쿼리처리프레임워크를개발하며박사학위를받았고,ApacheSpark를구축한초창기Databricks엔지니어중한명이었습니다.Kothari는ThoughtSpot의초기엔지니어로,분산쿼리처리와대규모시스템최적화에집중하는팀을리드했습니다.​"현대인프라의복잡성과상호의존성으로인해장애나인시던트의근본원인을조사하는일은마치건초더미에서바늘을찾는것같습니다.단,그건초더미는축구장크기이고,백만개의다른바늘로만들어졌으며,끊임없이재배열되며불타고있습니다,"라고Agarwal은성명에서밝혔습니다.​기술적으로는프로덕션환경에서바로수정작업을자동화할수있지만,현재회사는엔지니어가검증하고구현할수있도록구체적솔루션을추천하며사람의개입을유지하고있습니다.회사는데이터볼륨이아니라조사된인시던트수를기준으로가격을산정하며,클라우드호스팅과셀프호스팅배포옵션을모두제공합니다.
7 조회
0 추천
11.13 등록
(퍼플렉시티가정리한기사)우크라이나는수백대의요격드론을자율적으로조정하여들어오는위협에대응할수있는AI기반"드론방어벽"방어시스템을배치한최초의국가가되었으며,러시아의집중적인공중공격에맞서싸우는가운데방공기술의새로운지평을열었습니다.프랑스스타트업Atreyd가개발하고NATO혁신경진대회를통해선정된DWS-1시스템은이번달우크라이나에도착했으며몇주내에작전운용될것으로예상됩니다.이번배치는실제전투상황에서이러한방어시스템이테스트되는최초의사례입니다.​혁명적방어아키텍처이시스템은지상기지에서발사되는200대의1인칭시점요격드론으로구성되어있으며,Atreyd의창립자는이를하늘의"비행하는드론지뢰밭"이라고묘사했다.각드론은단몇천달러의비용이드는소형폭발탄두를탑재하고있으며,들어오는무기근처에서폭발하여목표물에도달하기전에위협을무력화하도록설계되었다.​인공지능을통해단일운영자가최대100대의드론을동시에제어할수있으며,시스템은감지된위협궤적에따라방어막의구조를자동으로조정한다.이기술은3D지형매핑과아군식별시스템을통합하여GPS가차단된환경에서도작동할수있도록하는데,이는러시아가우크라이나에서전자전을광범위하게사용하고있다는점을고려할때매우중요한능력이다.​Atreyd의창립자는BusinessInsider에"우리는스스로를방어의마지막계층으로간주합니다"라고말했다.위협을요격하지않은드론은재사용을위해발사플랫폼으로돌아올수있어운영비용을더욱절감할수있다.​NATO혁신을위한시험장Atreyd는2025년3월에시작된NATO의혁신도전과제에서러시아의활공폭탄과공격드론에대한대응책을개발하기위한3개최종후보중하나로선정되었습니다.다른최종후보로는독일의TYTANTechnologies와프랑스의AltaAres가있으며,이들도현재우크라이나에서테스트중인요격드론시스템을개발했습니다.​드론장벽은초기에러시아의Shahed형배회탄약으로부터도시와주요기반시설을방어할예정입니다.이러한탄약은전례없는수량으로우크라이나에발사되었으며,2025년첫10개월동안44,000발이상이발사되어2024년전체대비303%증가했습니다.이러한위협에대해성공적으로작동한다면,이시스템은전선에더가까이배치되어러시아의활공폭탄을요격할수있으며,이는대응하기매우어려운것으로악명높은파괴적인무기입니다.​​방어력저하속시급한필요이번배치는우크라이나의방공요격률이급격히감소함에따라이루어졌습니다.2025년10월,우크라이나군은들어오는드론의80%를요격했으며,이는연초의거의100%에서감소한수치입니다.지난달에만1,200대이상의러시아미사일과드론이우크라이나방어망을뚫고들어왔으며,이는2월의수치보다거의두배에달합니다.​러시아는최근샤헤드드론과활공폭탄모두에제트엔진을장착하여업그레이드했으며,이를통해더빠르게이동하고전선후방최대200킬로미터까지목표물을타격할수있게되었습니다.이러한개조는우크라이나의전통적인방공시스템에부담을주었으며,비용효율적인요격솔루션의중요성이점점더커지고있습니다.
8 조회
0 추천
11.13 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입