Loading...

AI 뉴스

Nvidia가 기록적인 훈련 시간으로 AI 벤치마크를 석권하다

페이지 정보

작성자 xtalfi
작성일 2025.11.13 14:49
1,227 조회
0 추천
0 비추천

본문

smfS6N7aideSB7eA7JSz2H-1920-80.jpg

(퍼플렉시티가 정리한 기사)


NVIDIA는 화요일에 발표된 MLPerf Training v5.1 벤치마크에서 완전한 석권을 달성하여 7개 테스트 모두에서 가장 빠른 훈련 시간을 기록했으며, 모든 카테고리에서 결과를 제출한 유일한 플랫폼이 되었습니다. 이 회사는 5,120개의 Blackwell GPU를 사용하여 Meta의 Llama 3.1 405B 모델을 단 10분 만에 훈련시켜 새로운 업계 기록을 세웠으며, 이는 이전 최고 기록보다 2.7배 빠른 속도입니다.​

11월 12일 MLCommons에서 발표한 이번 결과는 MLPerf Training 역사상 어떤 회사도 4비트 FP4 정밀도를 사용한 첫 번째 사례로, 이 획기적인 기술은 동일한 수의 GPU에서 이전 세대 Hopper 아키텍처보다 최대 4배의 성능을 제공했습니다. NVIDIA의 독점 NVFP4 포맷은 엄격한 정확도 요구사항을 유지하면서 8비트 FP8보다 3배 빠른 속도로 계산을 가능하게 합니다.​


블랙웰 울트라 데뷔하다

Blackwell Ultra 기반 GB300 NVL72 랙 규모 시스템이 이번 라운드에서 MLPerf Training에 처음 등장했으며, 표준 Blackwell GPU보다 1.5배 높은 NVFP4 처리량과 어텐션 레이어를 위한 2배의 softmax 가속을 제공하는 향상된 Tensor Core를 특징으로 합니다. 이 시스템은 GPU당 279GB의 HBM3e 메모리를 탑재하고 NVIDIA Quantum-X800 InfiniBand를 통해 업계 최초의 800 Gb/s 네트워킹 플랫폼으로 연결됩니다.​

NVIDIA는 또한 새로 도입된 두 가지 벤치마크인 Llama 3.1 8B와 FLUX.1 이미지 생성에서 성능 기록을 세웠습니다. 이 회사는 512개의 Blackwell Ultra GPU를 사용하여 5.2분 만에 Llama 3.1 8B를 학습시켰으며, FLUX.1에 대한 결과를 제출한 유일한 플랫폼으로서 1,152개의 Blackwell GPU로 12.5분의 학습 시간을 달성했습니다.​


다양한 경쟁 분야

MLPerf Training v5.1 라운드에는 20개 조직이 참여하여 12개의 서로 다른 하드웨어 가속기를 탑재한 65개의 고유한 시스템을 제출했습니다. AMD는 새로운 Instinct MI355X 및 MI350X GPU를 선보였으며, AMD는 단일 노드 접근성을 위해 설계된 새로운 Llama 3.1 8B 벤치마크 개발을 주도했습니다. AMD에 따르면, MI355X GPU 성능은 Llama 3.1 8B 테스트에서 NVIDIA의 Blackwell 플랫폼 대비 5-6% 이내의 차이를 보였습니다.​

전체 제출물의 거의 절반이 멀티 노드 구성이었으며, 이는 전년도 라운드 대비 86% 증가한 수치입니다. Datacrunch, University of Florida, Wiwynn이 처음으로 참여했으며, Dell, HPE, Lenovo와 같은 기존 참가자들도 함께했습니다.​

벤치마크 업데이트에서는 레거시 테스트를 최신 AI 워크로드로 대체했습니다: 언어 모델의 경우 BERT를 Llama 3.1 8B로, 이미지 생성의 경우 Stable Diffusion v2를 FLUX.1로 교체했습니다.

댓글 0
전체 1,366 / 56 페이지
26일서울양재aT센터에서개막한'코리아핀테크위크2025'에서금융권의인공지능(AI)대전환의지와함께이를가로막는규제과제가동시에부각됐다.이억원금융위원장은개막식에서"금융권의AI대전환이대한민국신성장동력의첨병이될것"이라며150조원규모의국민성장펀드조성과금융권AI플랫폼구축을통해혁신을지원하겠다고밝혔다.​​AI서비스경쟁본격화네이버페이,카카오페이,토스,뱅크샐러드등주요핀테크기업들은이번행사에서AI기반맞춤형금융서비스를대거선보였다.네이버페이는18일출시한오프라인통합단말기'Npay커넥트'를통해얼굴인식결제'페이스사인'과상권분석서비스를제공한다.카카오페이는AI금융비서'페이AI'로건강데이터기반보험분석과소비패턴분석을통한맞춤형혜택제안서비스를선보였다.토스는'페이스페이'와함께생활데이터를분석한'건강생활점수'를내세웠고,뱅크샐러드는마이데이터AI에이전트'토핑+'를공개해내년정식출시를예고했다.​규제가발목잡는혁신그러나금융권의AI도입은규제장벽에직면해있다.GPT-4기반서비스를구축한금융사들은GPT-5.1등최신모델로업데이트하려면혁신금융서비스재승인을받아야하며,이과정에최대120일이소요된다.한금융사AI담당임원은"단순모델을바꾸는것까지개별적으로승인받는건지나치게비효율적"이라고지적했다.망분리규제도여전히걸림돌로작용하고있다.금융당국이2024년8월망분리규제를완화하면서최근2년간AI혁신금융서비스가200건에육박했지만,전문가들은물리적망제한의추가완화와민간주도의자율규율기반위험관리체계로의전환이필요하다고제언한다.국제금융센터는최근보고서에서"AI설명가능성관련현실적접근방안을고려해야한다"며완벽한설명가능성보다설명불가능성을AI의본질적리스크로인정하는규제개선을촉구했다.
695 조회
0 추천
2025.11.27 등록
OpenAI는2030년까지확장계획을이행하기위해2,070억달러의추가자금조달이필요하다고이번주발표된HSBC글로벌투자리서치보고서에따르면,이는인공지능선구자의성공에막대한투자를한주요기술기업들의사업전망을위협할가능성이있다.​자금부족은OpenAI의최근클라우드컴퓨팅약정에서비롯되었으며,총약6,000억달러규모로Oracle과의3,000억달러계약,Microsoft와의2,500억달러계약,그리고AmazonWebServices와의380억달러계약을포함한다.NicolasCote-Colisson이이끄는HSBC의반도체분석팀은예상되는수익성장에도불구하고OpenAI의누적잉여현금흐름이2030년까지마이너스를유지할것으로전망한다.​인프라비용증가2025년말에서2030년사이,OpenAI는약7,920억달러의클라우드및AI인프라비용이예상되며,2033년까지컴퓨팅총약정금액은1조4,000억달러에달할것으로보입니다.데이터센터임대비용만해도6,200억달러에이를것으로전망됩니다.HSBC는OpenAI가2030년까지연간약2,130억달러의수익을올릴것으로예측합니다.이는회사가현재8억명에서30억명의정기이용자—전세계15세이상성인의44%—를확보할경우를가정한수치입니다.​이은행은구독률예상치를8%에서10%로상향조정했으며,더높은기업API수요와디지털광고수익도반영했습니다.그러나이러한낙관적인가정에도불구하고,추가부채,자본투입또는강화된수익전략을통해메워야할상당한자금격차가남아있습니다.​시장우려증가자금조달문제는이미금융시장에영향을미치고있습니다.오라클(Oracle)은9월자사의3,000억달러규모OpenAI계약을발표한후주가가한때30%급등했다가모든상승분을잃으면서심각한변동성을겪었습니다.회사의5년만기신용부도스와프(CDS)프리미엄은올해초약55bp에서11월에는거의80bp까지상승했으며,이는부채를이용한AI사업확장에대한투자자우려가커졌음을반영합니다.​오라클의공동창업자인래리엘리슨(LarryEllison)은9월OpenAI발표이후잠시세계에서가장부유한인물이되었으나,주가가하락하면서그의재산도감소했습니다.​HSBC는오라클,마이크로소프트,아마존,엔비디아(NVIDIACorporation),어드밴스드마이크로디바이시스(AdvancedMicroDevices,Inc.)를OpenAI의성공또는실패에가장큰영향을받는기업으로지목했습니다.OpenAI지분11%를보유한소프트뱅크(SoftBank)역시상당한변동성을겪었으며,AI거품에대한우려가커지는가운데10월말고점대비주가가40%하락했습니다.​보고서는OpenAI가급격한사용자증가나구독전환율상승을통해자금격차를극복할가능성이있지만,HSBC는이러한시나리오가여전히불확실하다고언급했습니다.
716 조회
0 추천
2025.11.27 등록
인공지능코딩어시스턴트가개발자들사이에서인기를얻고있는가운데,새로운연구결과가우려스러운보안환경을드러냈습니다.애플리케이션보안기업EndorLabs의조사에따르면,AI코딩에이전트가권장하는종속성중단5분의1만이안전하게사용할수있는것으로나타났습니다.​이번달발표된회사의2025종속성관리현황보고서에서는AI모델에따라코딩에이전트가가져온종속성의44-49%가알려진보안취약점을포함하고있다는것을발견했습니다.나머지안전하지않은종속성은"환각된"패키지로구성되어있었는데,이는그럴듯하게들리지만실제로는존재하지않는소프트웨어구성요소로서,"슬롭스쿼팅(slopsquatting)"이라고불리는새로운공급망공격의여지를만들어냅니다.​보안우려는결함이있는종속성을넘어확장됩니다.IEEE의기술과사회에관한국제심포지엄에발표된연구에서는AI가생성한코드가연구자들이"피드백루프보안저하"라고부르는현상을경험한다는것을밝혔습니다.40라운드반복에걸친400개의코드샘플을분석한결과,이연구는AI주도코드개선의단5번의반복후중대한취약점이37.6%증가했다는것을문서화했습니다.후기반복은초기반복보다일관되게더많은취약점을생성했으며,이는반복적인개선이코드품질을향상시킨다는가정에의문을제기합니다.​전통적인버그를넘어선설계결함아키텍처와의도를고려하는인간개발자와달리,AI모델은다음토큰을예측하여암호화라이브러리를교체하거나,토큰수명을변경하거나,인증로직을수정함으로써보안을약화시키는미묘한설계결함을도입합니다.학술연구에따르면AI가생성한코드의약3분의1이알려진취약점을포함하고있으며,Veracode의100개이상의대규모언어모델에대한종합분석에서는AI가생성한코드의45%가보안결함을도입하는것으로나타났습니다.​이문제는프로그래밍언어전반에걸쳐나타나지만,심각도는다양합니다.Java는72%의보안실패율로가장높은위험을보이는반면,Python은62%의보안통과율을,JavaScript는57%,C#은55%를나타냅니다.크로스사이트스크립팅과로그인젝션은특히문제가되는데,AI모델이각각86%와88%의비율로안전하지않은코드를생성합니다.​최근사건들은이러한위험을강조합니다.OXSecurity테스트에서Lovable,Base44,Bolt를포함한AI앱빌더가사용자가명시적으로보안애플리케이션을요청했을때조차기본적으로저장된크로스사이트스크립팅취약점이있는코드를생성하는것으로밝혀졌습니다.한편,연구자들은GitHubCopilot과GitLabDuo에서소스코드도용,프롬프트인젝션공격,자격증명탈취를가능하게하는심각한취약점을발견했습니다.​새로운공격표면AI에이전트를타사도구및통합과연결하는ModelContextProtocol은또다른취약점벡터로부상했습니다.이번주정리된보안타임라인은샌드박스탈출,악성서버패키지,수천개의애플리케이션을노출시킨과도한권한의API토큰을포함하여2025년내내발생한여러MCP관련침해사례를문서화하고있습니다.EndorLabs연구원들은MCP서버의75%가개인개발자에의해구축되었으며,41%는라이선스정보가부족하고,82%는신중한보안통제가필요한민감한API를사용하고있다는것을발견했습니다.​"AI코딩에이전트는현대개발워크플로우의필수적인부분이되었습니다"라고EndorLabs의보안연구원HenrikPlate는말했습니다."충분한검증없이는악용을위한새로운경로를열수있습니다."​AI코딩도구의확산은둔화될기미를보이지않습니다.StackOverflow의2025년개발자설문조사에따르면,개발자의84%가개발프로세스에서AI도구를사용중이거나사용할계획이며,전문개발자의51%가매일이를사용하고있습니다.그러나개발자신뢰는도입에뒤처지고있습니다:46%가AI도구출력의정확성을적극적으로불신하고있으며,이는전년도31%에서증가한수치이고,66%는"거의맞지만완전히맞지는않은AI솔루션"에대한불만을언급했습니다.
701 조회
0 추천
2025.11.27 등록
한국과학기술원(KAIST)의연구진은인공지능시스템내부를들여다보고개념이어떻게형성되는지시각화할수있는새로운방법을개발했으며,이는전문가들이AI가어떻게사고하는지를이해하는데있어중요한진전이라고평가하고있습니다.​‘세분화개념회로(GranularConceptCircuits)’로불리는이기술은딥러닝모델의내부의사결정과정을설명하는오랜과제를해결했습니다.딥러닝모델은전통적으로이해하기어려운‘블랙박스’로작동해왔기때문입니다.KAIST는10월호놀룰루에서열린국제컴퓨터비전학회(InternationalConferenceonComputerVision)에서연구팀이이결과를발표한데이어,11월26일이번혁신을공식발표했습니다.​뉴런에서회로로의전환KAIST김재철AI대학원최재식교수연구팀은기존의개별뉴런에서벗어나여러뉴런이협력하여개념을인식하는회로(신경망)를중심으로접근방법을확장하여해당방식을개발했다.기존방법들은"특정뉴런이특정개념을감지한다"고가정했지만,연구팀은딥러닝모델이사실상여러뉴런이협동하는구조적회로를통해개념을형성한다는사실을발견했다.​시스템은뉴런이특정특징에얼마나강하게반응하는지를측정하는'뉴런감도'와,다음개념으로특징이얼마나강하게전달되는지를보여주는'의미흐름'이라는두가지핵심지표를계산하여이러한회로를자동으로추적한다.이측정을바탕으로색깔,질감등기초적인특징들이점진적으로더높은수준의개념으로조합되는과정을시각화할수있다.​연구진은이러한발견을검증하기위해특정회로를비활성화하는실험을진행했다.특정개념을담당하는회로가꺼질때AI의예측결과가변하는현상이관찰되었고,이를통해해당회로가실제로예상했던인식기능을수행함을직접적으로입증했다.​AI투명성의실용적적용Ph.D.후보자인권다희와이세현이공동제1저자로참여한이번연구는AI의사결정의투명성강화,오분류원인분석,편향탐지,모델디버깅및아키텍처개선등설명가능한AI영역전반에걸친응용가능성을시사한다.연구진은"이기술은AI가내부적으로형성하는개념구조를사람이이해할수있는방식으로보여준다"고밝히며,이번연구가"AI가어떻게생각하는지연구하는과학적출발점역할을한다"고덧붙였다.​최교수는이번접근법이기존방식과는다르다고강조했다."복잡한모델을설명을위해단순화한기존접근법과달리,본연구는미세한회로수준에서모델내부를정밀하게해석하는최초의접근법이다"고말했다.
698 조회
0 추천
2025.11.27 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입