Loading...

AI 뉴스

Nvidia가 기록적인 훈련 시간으로 AI 벤치마크를 석권하다

페이지 정보

작성자 xtalfi
작성일 11.13 14:49
28 조회
0 추천
0 비추천

본문

smfS6N7aideSB7eA7JSz2H-1920-80.jpg

(퍼플렉시티가 정리한 기사)


NVIDIA는 화요일에 발표된 MLPerf Training v5.1 벤치마크에서 완전한 석권을 달성하여 7개 테스트 모두에서 가장 빠른 훈련 시간을 기록했으며, 모든 카테고리에서 결과를 제출한 유일한 플랫폼이 되었습니다. 이 회사는 5,120개의 Blackwell GPU를 사용하여 Meta의 Llama 3.1 405B 모델을 단 10분 만에 훈련시켜 새로운 업계 기록을 세웠으며, 이는 이전 최고 기록보다 2.7배 빠른 속도입니다.​

11월 12일 MLCommons에서 발표한 이번 결과는 MLPerf Training 역사상 어떤 회사도 4비트 FP4 정밀도를 사용한 첫 번째 사례로, 이 획기적인 기술은 동일한 수의 GPU에서 이전 세대 Hopper 아키텍처보다 최대 4배의 성능을 제공했습니다. NVIDIA의 독점 NVFP4 포맷은 엄격한 정확도 요구사항을 유지하면서 8비트 FP8보다 3배 빠른 속도로 계산을 가능하게 합니다.​


블랙웰 울트라 데뷔하다

Blackwell Ultra 기반 GB300 NVL72 랙 규모 시스템이 이번 라운드에서 MLPerf Training에 처음 등장했으며, 표준 Blackwell GPU보다 1.5배 높은 NVFP4 처리량과 어텐션 레이어를 위한 2배의 softmax 가속을 제공하는 향상된 Tensor Core를 특징으로 합니다. 이 시스템은 GPU당 279GB의 HBM3e 메모리를 탑재하고 NVIDIA Quantum-X800 InfiniBand를 통해 업계 최초의 800 Gb/s 네트워킹 플랫폼으로 연결됩니다.​

NVIDIA는 또한 새로 도입된 두 가지 벤치마크인 Llama 3.1 8B와 FLUX.1 이미지 생성에서 성능 기록을 세웠습니다. 이 회사는 512개의 Blackwell Ultra GPU를 사용하여 5.2분 만에 Llama 3.1 8B를 학습시켰으며, FLUX.1에 대한 결과를 제출한 유일한 플랫폼으로서 1,152개의 Blackwell GPU로 12.5분의 학습 시간을 달성했습니다.​


다양한 경쟁 분야

MLPerf Training v5.1 라운드에는 20개 조직이 참여하여 12개의 서로 다른 하드웨어 가속기를 탑재한 65개의 고유한 시스템을 제출했습니다. AMD는 새로운 Instinct MI355X 및 MI350X GPU를 선보였으며, AMD는 단일 노드 접근성을 위해 설계된 새로운 Llama 3.1 8B 벤치마크 개발을 주도했습니다. AMD에 따르면, MI355X GPU 성능은 Llama 3.1 8B 테스트에서 NVIDIA의 Blackwell 플랫폼 대비 5-6% 이내의 차이를 보였습니다.​

전체 제출물의 거의 절반이 멀티 노드 구성이었으며, 이는 전년도 라운드 대비 86% 증가한 수치입니다. Datacrunch, University of Florida, Wiwynn이 처음으로 참여했으며, Dell, HPE, Lenovo와 같은 기존 참가자들도 함께했습니다.​

벤치마크 업데이트에서는 레거시 테스트를 최신 AI 워크로드로 대체했습니다: 언어 모델의 경우 BERT를 Llama 3.1 8B로, 이미지 생성의 경우 Stable Diffusion v2를 FLUX.1로 교체했습니다.

댓글 0
전체 1,021 / 27 페이지
(퍼플렉시티가 정리한 기사)Liquid AI는 수요일에 Shopify [ -6.55%]와 다년간의 파트너십을 발표하며, 전자상거래 플랫폼 전반에 걸쳐 Liquid Foundation Models를 배포할 예정이라고 밝혔습니다. 이는 20밀리초 미만의 AI 모델을 대규모로 상용 배포하는 첫 사례 중 하나입니다.매사추세츠주 케임브리지에 본사를 둔 이 스타트업은 검색 및 멀티모달 애플리케이션을 포함하여 Shopify 플랫폼의 품질 민감 워크플로우를 위해 자사의 주력 모델을 라이선스할 예정입니다. 첫 번째 프로덕션 배포는 수백만 명의 판매자와 쇼핑객을 위한 검색 기능을 향상시키는 20밀리초 미만의 텍스트 모델입니다.새로운 아키텍처를 통한 성능 향상Liquid AI에 따르면, 이 회사의 모델은 인기 있는 오픈소스 대안들보다 훨씬 적은 매개변수를 사용하면서도 더 빠른 추론 시간을 달성합니다. 특정 실제 운영 환경과 유사한 작업에서, 약 50% 더 적은 매개변수를 가진 LFM은 알리바바의 Qwen3, 구글의 Gemma3, 메타의 Llama 3와 같은 모델들을 능가했으며, 2배에서 10배 더 빠른 추론을 제공했습니다.“이와 같은 실제 워크로드에서 20ms 미만의 추론을 제공하는 곳은 아무도 없습니다”라고 Shopify의 최고기술책임자인 Mikhail Parakhin이 성명에서 밝혔습니다. 2024년 9월 마이크로소프트에서 AI 개발을 이끈 후 Shopify에 합류한 Parakhin은 이 아키텍처가 “품질을 희생하지 않고” 효율성을 제공한다고 덧붙였습니다.이 파트너십은 2024년 12월 Liquid AI의 2억 5천만 달러 규모 시리즈 A 펀딩 라운드에 Shopify가 참여한 것을 기반으로 합니다. 이 펀딩은 칩 제조업체 AMD가 주도했으며, 이 스타트업의 가치를 20억 달러 이상으로 평가했습니다.추천 시스템이 초기 결과를 보여줍니다두 회사는 새로운 HSTU 아키텍처를 사용하여 생성형 추천 시스템을 공동 개발했습니다. 통제된 테스트에서 이 모델은 Shopify의 이전 시스템을 능가했으며, 발표에 따르면 추천을 통한 전환율이 더 높아졌습니다.Liquid AI의 CEO인 Ramin Hasani는 “추천은 금융, 의료, 전자상거래 분야의 의사결정 백본입니다”라고 말했습니다. “실제 세계에서 유용하려면 모델은 신뢰할 수 있고, 효율적이며, 빨라야 합니다.”파트너십에는 저지연 Shopify 워크로드 전반에 걸친 LFM의 다목적 라이선스, 지속적인 연구 개발 협력, 공유 로드맵이 포함됩니다. 초기 배포는 검색을 위한 텍스트 모델에 중점을 두고 있지만, 두 회사는 고객 프로필, 에이전트, 제품 분류를 포함한 추가 사용 사례를 위해 멀티모달 모델을 평가하고 있습니다.[파트너십의 재정적 조건은 공개되지 않았습니다. 이 협력은 Liquid AI가 미세한 벌레의 신경 구조에서 영감을 받아 MIT에서 개발한 액체 신경망 기술을 전자상거래, 금융 서비스 및 기타 분야의 상용 생산에 도입하려는 노력을 나타냅니다.
24 조회
0 추천
11.14 등록
(퍼플렉시티가정리한기사)AI보안회사Mindgard가11월12일공개한보고서에따르면,OpenAI의Sora2비디오생성모델의취약점으로인해공격자가오디오전사를통해숨겨진시스템프롬프트를추출할수있다고합니다.이번발견은텍스트,이미지,비디오,오디오간의변환이정보유출을위한예상치못한경로를만드는멀티모달AI시스템의새로운보안과제를강조합니다.​오디오전사가보안장치를우회합니다AaronPortnoy가이끄는Mindgard연구원들은11월3일Sora2를대상으로실험을시작했으며,15초길이의짧은클립으로음성을생성하는것이모델의기초명령어를복구하는가장충실도높은방법임을발견했습니다.전통적인시각적방법은이미지와비디오프레임에렌더링된텍스트가시퀀스전반에걸쳐빠르게왜곡되어글자가읽을수없는근사치로변형되면서실패했습니다.QR코드와같은인코딩된형식역시똑같이신뢰할수없는것으로판명되었으며,Mindgard의보고서에따르면"시각적으로는그럴듯하지만디코딩가능한횡설수설"을생성했습니다.​획기적인발견은연구원들이Sora2에게시스템프롬프트의일부를말하도록요청했을때이루어졌으며,시간제한내에더많은내용을담기위해종종가속화된속도로진행되었습니다.이러한오디오클립을전사하고조각들을이어붙임으로써,그들은메타데이터를먼저생성하고,명시적으로요청되지않는한저작권이있는캐릭터를피하며,성적으로암시적인콘텐츠를금지하는등의규칙을드러내는거의완전한시스템프롬프트를재구성했습니다.​AI보안에대한광범위한영향OpenAI는11월4일다중모달시스템전반의프롬프트추출위험에대한일반적인인식을언급하며이취약점을인정했다.Sora2의시스템프롬프트자체에는매우민감한데이터가포함되어있지않지만,보안연구원들은시스템프롬프트가행동가드레일로기능하며구성비밀로취급되어야한다고강조한다.Mindgard는보고서에서"시스템프롬프트는모델안전경계를정의하며,유출될경우후속공격을가능하게할수있다"고밝혔다.​이취약점은다중모달모델의고유한약점을악용하는데,변환과정에서의미적표류가누적된다.AI시스템이여러데이터유형을처리함에따라시스템지침을보호하는것이점점더어려워지고있다.Mindgard는개발자들이시스템프롬프트를독점정보로취급하고,오디오및비디오출력에서유출을테스트하며,생성물에길이제한을구현할것을권장한다.​이번공개는9월말에출시된Sora2에대한광범위한조사가이루어지는가운데나왔다.PublicCitizen은11월11일딥페이크와유해콘텐츠에대한우려를이유로OpenAI에이도구를임시철회할것을촉구했다.OpenAI는Sora2에여러안전계층이포함되어있다고주장해왔지만,비평가들은그효과에의문을제기하고있다.
29 조회
0 추천
11.14 등록
(퍼플렉시티기정리한기사)부산대학교와서울대학교의연구진들이올해저명한통계학저널에발표한연구결과에따르면,데이터왜곡에대항하여인공지능및의료영상시스템을강화할수있는새로운통계적방법을개발했습니다.휴버평균(Hubermean)이라고불리는이방법은현대데이터과학의지속적인과제를다룹니다:평평한표면이아닌곡면기하학적공간에존재하는정보를분석하는것입니다.3차원의료스캔부터로봇방향데이터에이르기까지,오늘날의복잡한데이터대부분은수학자들이리만다양체라고부르는공간에존재하며,여기서전통적인통계도구들은노이즈나이상치에직면했을때종종실패합니다.​정확한분석을위한장벽허물기부산대학교통계학과이종민교수는서울대학교정성규교수와함께2025년8월25일JournaloftheRoyalStatisticalSociety:SeriesB에연구를발표했다.​연구발표에따르면이교수는"우리연구는리만다양체에서고전적인프레셰평균의강건한일반화를소개한다"며"이는이상치에대한더큰안정성을제공하고기하학적데이터에대한통계분석의신뢰성을향상시킨다"고말했다.​Huber평균은데이터구조에자동으로적응하여,일반적인관측값에대해서는최소제곱손실을사용하고큰편차에대해서는절대편차손실을사용한다.이러한균형을통해0.5의붕괴점을달성할수있으며,이는데이터의절반이이상치이거나극단값이더라도추정량이신뢰할수있음을의미한다.​산업전반의응용분야이방법의잠재적응용분야는과학및공학분야전반에걸쳐확장됩니다.의료영상분야에서Huber평균은뇌나장기형상데이터의평균화를개선하여더정확한진단으로이어질수있습니다.로봇공학분야에서는시스템이소음이많거나예측불가능한환경에서도움직임및방향데이터를더잘해석하는데도움이될수있습니다.AI및머신러닝분야에서는기하학적데이터를다루는모델을더견고하게만들수있습니다.​이교수는"강건하고기하학적으로인식하는데이터분석의기반을제공함으로써,이연구는신뢰할수있는차세대AI,정밀의료,그리고실제세계와상호작용하는지능형기술을조용히뒷받침할수있을것"이라고덧붙였습니다.​이연구는추정량의존재성,유일성,수렴성,불편성에대한이론적보장과함께실제로빠르게수렴하는새로운계산알고리즘을제공합니다.
21 조회
0 추천
11.14 등록
(퍼플렉시티가정리한기사)장수산업은"에이전틱AI(AgenticAI)"—지속적인학습과자율적의사결정이가능한적응형인공지능시스템—가개념에서임상적용으로이동하면서새로운장을맞이하고있습니다.11월11일발표된바에따르면,전문가들은이러한자가개선시스템을개인의생물학적데이터와생활습관데이터를지속적으로분석하는지능형건강동반자로묘사하며,이는단순히정적보고서를생성하는기존AI모델과는차별화된다고설명합니다.​TechIPM의수석컨설턴트인AlexLee는기존AI가일회성예측을생성하는계산기처럼작동하는반면,에이전틱AI는혈액검사결과,웨어러블데이터,영양기록과같은입력값으로부터지속적으로학습하는살아있는시스템처럼행동한다고설명합니다.이기술은Hevolution과같은재단과RetroBiosciences,AltosLabs와같은기업들로부터수십억달러가장수연구에투입되는시점에등장했으며,이들은생물학적노화를늦추거나역전시키는데투자하고있습니다.​데이터에서동적건강관리로여러기업들이이미에이전틱AI플랫폼의기반을마련하는인프라를구축하고있습니다.토니로빈스와피터디아만디스박사가공동설립한FountainLife는11월11일,자사의ZoriAI의료보조시스템이이제OuraRing,Watch,WHOOP을포함한모든주요웨어러블기기와통합된다고발표했습니다.이플랫폼은이미징,유전체학,대사체학과같은고급진단과함께라이프스타일데이터를종합하여패턴을식별하고잠재적인건강위험을알려줍니다.FountainLife는8월에시리즈B펀딩으로1,800만달러를유치하여연간21,500달러부터시작하는멤버십을제공하는장수센터를확장했습니다.​유전체학선구자인J.크레이그벤터박사가공동설립한HumanLongevityInc.는2024년8월에AI기반건강위험플랫폼을발전시키고전세계로확장하기위해3,980만달러를유치했습니다.한편,InsideTracker는10월에웨어러블과일일저널에서최대15개의변수를분석하여장수개선에가장영향력있는주간습관을식별하는HealthspanHabitsScore기능을출시했습니다.​FDA는2015년부터2025년3월사이에1,000개이상의AI지원의료기기를승인했으며,규제당국은AI지원의료기기용소프트웨어도구를점점더인정하고있습니다.FHIR과같은상호운용성표준은이제웨어러블데이터,검사결과및건강기록을안전하게연결할수있게하여,장수기술을부티크웰니스에서합법적인예방의학으로전환시키고있습니다.​건강수명-기대수명격차해소에이전틱AI에대한추진은전세계적으로건강수명-기대수명격차(질병이나장애를안고살아가는기간)가2000년8.5년에서2019년9.6년으로확대된가운데이루어지고있습니다.미국의경우,이격차는2000년10.9년에서2024년12.4년으로증가하여전세계평균보다29%높습니다.​에이전틱AI의잠재력은개인치료를넘어확장됩니다.연합학습을활용하여이러한시스템은수천명의사용자를연결하여개인데이터를노출하지않고도공통된건강패턴을발견할수있으며,이를통해공중보건기관이질병이발생하기전에예방전략을권장할수있게합니다.의빌게이츠는8월에알츠하이머연구를가속화하는에이전틱AI솔루션을위한100만달러상금경진대회를후원했으며,주최측은이기술이"수년간의연구를압축"할수있는능력을가지고있다고설명했습니다.​그러나전문가들은자동화에대한과도한의존,투명성부족,시스템이너무비싸게유지될경우건강불평등이심화될가능성등의위험에대해경고합니다.Lee는설명가능하고,윤리적이며,포용적인AI,즉사람들이이해하고신뢰할수있는기술을구축하는것이과제라고지적합니다.
21 조회
0 추천
11.14 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입