AI 뉴스

Nvidia가 기록적인 훈련 시간으로 AI 벤치마크를 석권하다

페이지 정보

작성자 xtalfi
작성일 2025.11.13 14:49
1,037 조회
0 추천
0 비추천

본문

smfS6N7aideSB7eA7JSz2H-1920-80.jpg

(퍼플렉시티가 정리한 기사)


NVIDIA는 화요일에 발표된 MLPerf Training v5.1 벤치마크에서 완전한 석권을 달성하여 7개 테스트 모두에서 가장 빠른 훈련 시간을 기록했으며, 모든 카테고리에서 결과를 제출한 유일한 플랫폼이 되었습니다. 이 회사는 5,120개의 Blackwell GPU를 사용하여 Meta의 Llama 3.1 405B 모델을 단 10분 만에 훈련시켜 새로운 업계 기록을 세웠으며, 이는 이전 최고 기록보다 2.7배 빠른 속도입니다.​

11월 12일 MLCommons에서 발표한 이번 결과는 MLPerf Training 역사상 어떤 회사도 4비트 FP4 정밀도를 사용한 첫 번째 사례로, 이 획기적인 기술은 동일한 수의 GPU에서 이전 세대 Hopper 아키텍처보다 최대 4배의 성능을 제공했습니다. NVIDIA의 독점 NVFP4 포맷은 엄격한 정확도 요구사항을 유지하면서 8비트 FP8보다 3배 빠른 속도로 계산을 가능하게 합니다.​


블랙웰 울트라 데뷔하다

Blackwell Ultra 기반 GB300 NVL72 랙 규모 시스템이 이번 라운드에서 MLPerf Training에 처음 등장했으며, 표준 Blackwell GPU보다 1.5배 높은 NVFP4 처리량과 어텐션 레이어를 위한 2배의 softmax 가속을 제공하는 향상된 Tensor Core를 특징으로 합니다. 이 시스템은 GPU당 279GB의 HBM3e 메모리를 탑재하고 NVIDIA Quantum-X800 InfiniBand를 통해 업계 최초의 800 Gb/s 네트워킹 플랫폼으로 연결됩니다.​

NVIDIA는 또한 새로 도입된 두 가지 벤치마크인 Llama 3.1 8B와 FLUX.1 이미지 생성에서 성능 기록을 세웠습니다. 이 회사는 512개의 Blackwell Ultra GPU를 사용하여 5.2분 만에 Llama 3.1 8B를 학습시켰으며, FLUX.1에 대한 결과를 제출한 유일한 플랫폼으로서 1,152개의 Blackwell GPU로 12.5분의 학습 시간을 달성했습니다.​


다양한 경쟁 분야

MLPerf Training v5.1 라운드에는 20개 조직이 참여하여 12개의 서로 다른 하드웨어 가속기를 탑재한 65개의 고유한 시스템을 제출했습니다. AMD는 새로운 Instinct MI355X 및 MI350X GPU를 선보였으며, AMD는 단일 노드 접근성을 위해 설계된 새로운 Llama 3.1 8B 벤치마크 개발을 주도했습니다. AMD에 따르면, MI355X GPU 성능은 Llama 3.1 8B 테스트에서 NVIDIA의 Blackwell 플랫폼 대비 5-6% 이내의 차이를 보였습니다.​

전체 제출물의 거의 절반이 멀티 노드 구성이었으며, 이는 전년도 라운드 대비 86% 증가한 수치입니다. Datacrunch, University of Florida, Wiwynn이 처음으로 참여했으며, Dell, HPE, Lenovo와 같은 기존 참가자들도 함께했습니다.​

벤치마크 업데이트에서는 레거시 테스트를 최신 AI 워크로드로 대체했습니다: 언어 모델의 경우 BERT를 Llama 3.1 8B로, 이미지 생성의 경우 Stable Diffusion v2를 FLUX.1로 교체했습니다.

댓글 0
전체 1,366 / 81 페이지
CommonSenseMedia와스탠포드의대의BrainstormLabforMentalHealthInnovation이목요일에발표한보고서에따르면,널리사용되는네개의AI챗봇이청소년의정신건강위기상황을시뮬레이션한사례에서제대로식별하거나적절하게대응하지못한것으로나타났습니다.수개월에걸쳐OpenAI의ChatGPT,Anthropic의Claude,Google의Gemini,그리고MetaAI를평가한이보고서는해당시스템들이"청소년에게영향을미치는정신건강문제의전체스펙트럼에는근본적으로안전하지않다"고결론지었습니다.​연구진은부모통제가가능한곳에서는설정을활성화한10대테스트계정을이용해수천번의대화를진행하며챗봇이불안,우울증,섭식장애,ADHD,PTSD,조증,정신증등청소년약20%에게영향을미치는다양한상황을어떻게처리하는지평가했습니다.실험결과챗봇은자살이나자해를명시적으로언급하는짧은대화에서는적절하게반응했으나,실제청소년의사용을반영한더긴대화에서는효과가"극적으로저하"된것으로나타났습니다.​챗봇이망상을확인해주고경고신호를놓쳤다한상호작용에서,Gemini는미래를"예측하는도구"를만들었다고주장하는시뮬레이션된사용자에게"믿을수없을정도로흥미롭다"고응답하며"개인적인수정구슬"에대해신나게질문을던졌고,이는정신병의증상을인식하지못한행동이었다.비슷하게,MetaAI는처음에는섭식장애의징후를감지했으나,평가자가속이불편하다고언급하자곧바로다른방향으로안내했고,ChatGPT는장기간의대화중에정신병의명확한징후를파악하지못했다.​"아이들이정신건강지원을위해AI를사용하는것은안전하지않습니다,"라고CommonSenseMedia의AI프로그램수석이사RobbieTorney가말했다."기업들이자살예방을위한필수적인안전성개선에집중해왔지만,우리테스트결과여러상태에걸쳐체계적인문제가드러났습니다".​기업들,소송증가속에서조사결과에이의제기이보고서는AI기업들이자사의챗봇이청소년자살에기여했다고주장하는여러소송에직면한가운데나왔다.OpenAI는최소8건의개별소송을방어하고있으며,여기에는ChatGPT를광범위하게사용한후4월에자살로사망한16세AdamRaine의부모가2025년8월에제기한소송이포함된다.Google은자사가투자한스타트업인Character.AI와관련하여10대사망사건과연결된소송에직면해있다.​OpenAI대변인은이평가가"민감한대화를위해우리가마련한포괄적인안전장치를반영하지않는다"며"현지화된위기상담전화,휴식알림,업계최고수준의부모알림등이포함된다"고밝혔다.Meta는이테스트가"청소년을위해AI를더안전하게만들기위한중요한업데이트"이전에이루어졌다고말하며,자사의챗봇은"자해,자살또는섭식장애에대한연령부적절한논의에참여하지않도록훈련되었다"고덧붙였다.Google은"유해한결과를방지하기위해미성년자를위한특정정책과안전장치를마련했다"고강조했다.​Stanford의BrainstormLab설립자인NinaVasan박사는청소년의발달적취약성이"참여를유도하고,인정해주며,연중무휴24시간이용가능하도록설계된AI시스템과만난다"고경고하며,이러한조합을"특히위험하다"고말했다.
770 조회
0 추천
2025.11.21 등록
Perplexity는2025년11월20일안드로이드기기용CometAI브라우저를출시하며,최첨단AI기반브라우징도구를데스크톱에서모바일로처음전환했고,이는Google과의경쟁에서중대한확대를의미합니다.iOS앱출시가며칠내로예정된가운데,Comet의안드로이드우선출시는일반적으로iPhone사용자에게우선권을주는AI기술기업들사이에서드문접근방식입니다.​AI기반브라우징,이제Android에서도가능안드로이드용Comet은데스크톱버전에서개조된일련의지능형기능을제공합니다.여기에는통합AI어시스턴트,고급음성인식,스마트탭요약및내장광고차단기능이포함되며,모두모바일환경에최적화되어있습니다.사용자는음성모드로브라우저와대화하고,AI에게열린탭을요약하도록요청하며,즉석에서복잡한작업을할당할수있습니다.어시스턴트의확장된추론기능을통해사용자는백그라운드에서수행되는모든작업을검토하고제어할수있어투명성과개입지점을모두제공합니다.​Perplexity는모바일용진정한AI중심브라우저를구축하려면데스크톱경험을단순히이식하는대신"각OS에대한의도적인작업"이필요하다고강조합니다.회사는안드로이드플랫폼의개방성과사용자가기본브라우저를설정할수있는상대적용이성을인식하여Comet을안드로이드용으로특별히재설계했습니다.이는iOS기기에서악명높게더복잡한프로세스입니다.​거대기술기업에대한전략적압박Android를먼저선택함으로써Perplexity는Google의Chrome브라우저뿐만아니라Android기기의Chrome에번들로제공되는Gemini와같은최신AI기능과도직접경쟁하게되었습니다.Perplexity의대변인은통신사와기기제조업체들이Comet의사전설치를요청했다고언급했으며,이는AI브라우저시장이뜨거워지면서대안에대한수요가증가하고있음을반영합니다.​Perplexity는Comet을"최초의진정한AI네이티브브라우저"로묘사하고있으며,이는Comet,ChatGPTAtlas,Dia와같은에이전틱브라우저들이브라우징경험내에서검색,조사,심지어거래작업까지자동화함으로써사용자가인터넷과상호작용하는방식을재편하고있는급변하는시장을반영합니다.​사용자경험,보안질문,그리고다음단계초기사용자피드백과리뷰는Comet의속도,효과적인요약,대화형어시스턴트,그리고깔끔한인터페이스를강조하고있습니다.AI어시스턴트는통합성,사용편의성,핸즈프리작동으로두각을나타내고있지만,배터리사용량과데이터프라이버시에대한우려는여전히남아있습니다.Comet의단계별프라이버시제어와AI작동에대한투명성은이러한우려중일부를해소하는것을목표로하고있습니다.​수백만명이매일Comet을사용하고있는것으로알려졌으며iOS출시를위한모멘텀이형성되고있는가운데,Perplexity의안드로이드에대한전략적베팅은AI브라우저전쟁을재편할수있습니다.AI기반개인어시스턴트가사람들이온라인에서정보를검색하고상호작용하는방식을점점더많이안내함에따라,브라우저제조사들간의경쟁은아직끝나지않았습니다.현재로서는Perplexity의안드로이드진출이오랫동안기존기술대기업들이지배해온영역에명확한깃발을꽂았습니다.
750 조회
0 추천
2025.11.21 등록
유대인혐오음모론에맞서도록훈련된AI챗봇이사용자들의이러한신념을줄이고유대인에대한인식을개선했다는연구결과가수요일에공개되었습니다.이연구는유대인명예훼손방지연맹(ADL)산하반유대주의연구센터소속연구진이발표한것입니다.효과는한달후에도지속되어,증가하는반유대주의에맞서새로운희망을제공합니다.​이실험에는적어도여섯가지의대표적인반유대인음모론중하나를믿는1,200명이상의사람들이참여했습니다.여기에는유대인들이미디어를통제한다거나,이민에유대인들이관여한다는‘위대한대체이론’등이포함됩니다.참가자들은이러한이론을반박하도록프로그래밍된AI모델과대화를나눴으며,이모델은Anthropic의Claude를기반으로만들어졌습니다.연구진이‘DebunkBot’이라고부르는챗봇과교류한사람들은대조군보다자신들의신념이훨씬더약해지는경향이나타났습니다.​​이번연구의시니어저자이자코넬대학교교수인데이비드랜드는“이연구결과가주목할만한점은,사실에기반한반박이정체성과편견에뿌리깊게연결되었고오랜역사를가진음모론에도효과가있다는것”이라고밝혔습니다.랜드는이어,“AI는대부분정확한정보와증거기반반론을제시함으로써,여전히사실이사람들의생각을바꿀수있음을보여준다”고덧붙였습니다.​잘못된정보의문제,단순한편견이아니다ADL의반유대주의연구센터를이끄는MattWilliams는이연구가반유대주의를주로시민권문제가아닌잘못된정보의문제로이해하는방식의전환을반영한다고말했습니다.지난10년동안음모론을믿는미국인의비율이역사적비율의두배이상인45%에달했다고Williams는말했습니다.​이연구는AI모델이증오확산에서차지하는역할에대한감시가증가하는가운데나왔습니다.이번주,프랑스당국은ElonMusk의Grok챗봇이한사용자에게나치가스실이대량학살을위해설계되지않았다고말했다는보도이후조사에착수했습니다.3월에발표된ADL보고서는주요AI언어모델에서반유대주의와반이스라엘편향을발견했습니다.​한계및다음단계연구결과에따르면DebunkBot은완전한해결책이아니었습니다.더많은반유대주의음모론을믿는사람들은더적은변화를경험했으며,믿음은감소했지만완전히제거되지는않았습니다.그럼에도불구하고Williams는음모론믿음에대응할수있는모든전략이가치있다고말했습니다.DebunkBot은현재온라인에서이용가능하며,ADL은주요AI플랫폼들이그전문성을통합하도록설득하기위해노력하고있습니다."AI와LLM들은도구입니다,그렇죠?"Williams가말했습니다."우리는도구를선과악을위해사용할수있습니다".
772 조회
0 추천
2025.11.21 등록
HarvardBusinessReview는채용관리자들이면접중지원자가AI를사용하는지탐지하려고하기보다는,챗봇이복제할수없는인간의기술,즉감성지능과적응력을평가할수있도록면접을재설계해야한다고주장합니다.​이기사는다섯가지핵심역량을테스트할것을권장합니다:사회적신호를읽고신체언어변화에반응하기,명확한답이없는모호한시나리오를통해추론하기,비판적사고를드러내는명확화질문하기,대화가예상치못한방향으로전개될때적응하기,그리고그룹환경에서협력적문제해결능력보여주기.​이러한접근방식은현재99%의채용관리자가채용과정에서어떤형태로든AI를사용하고있으며,지원자들은실시간으로면접응답을생성하기위해ChatGPT와같은도구에점점더의존하고있는상황에서증가하는과제를해결합니다.
745 조회
0 추천
2025.11.21 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입