Loading...

AI 뉴스

Nvidia가 기록적인 훈련 시간으로 AI 벤치마크를 석권하다

페이지 정보

작성자 xtalfi
작성일 2025.11.13 14:49
1,470 조회
0 추천
0 비추천

본문

smfS6N7aideSB7eA7JSz2H-1920-80.jpg

(퍼플렉시티가 정리한 기사)


NVIDIA는 화요일에 발표된 MLPerf Training v5.1 벤치마크에서 완전한 석권을 달성하여 7개 테스트 모두에서 가장 빠른 훈련 시간을 기록했으며, 모든 카테고리에서 결과를 제출한 유일한 플랫폼이 되었습니다. 이 회사는 5,120개의 Blackwell GPU를 사용하여 Meta의 Llama 3.1 405B 모델을 단 10분 만에 훈련시켜 새로운 업계 기록을 세웠으며, 이는 이전 최고 기록보다 2.7배 빠른 속도입니다.​

11월 12일 MLCommons에서 발표한 이번 결과는 MLPerf Training 역사상 어떤 회사도 4비트 FP4 정밀도를 사용한 첫 번째 사례로, 이 획기적인 기술은 동일한 수의 GPU에서 이전 세대 Hopper 아키텍처보다 최대 4배의 성능을 제공했습니다. NVIDIA의 독점 NVFP4 포맷은 엄격한 정확도 요구사항을 유지하면서 8비트 FP8보다 3배 빠른 속도로 계산을 가능하게 합니다.​


블랙웰 울트라 데뷔하다

Blackwell Ultra 기반 GB300 NVL72 랙 규모 시스템이 이번 라운드에서 MLPerf Training에 처음 등장했으며, 표준 Blackwell GPU보다 1.5배 높은 NVFP4 처리량과 어텐션 레이어를 위한 2배의 softmax 가속을 제공하는 향상된 Tensor Core를 특징으로 합니다. 이 시스템은 GPU당 279GB의 HBM3e 메모리를 탑재하고 NVIDIA Quantum-X800 InfiniBand를 통해 업계 최초의 800 Gb/s 네트워킹 플랫폼으로 연결됩니다.​

NVIDIA는 또한 새로 도입된 두 가지 벤치마크인 Llama 3.1 8B와 FLUX.1 이미지 생성에서 성능 기록을 세웠습니다. 이 회사는 512개의 Blackwell Ultra GPU를 사용하여 5.2분 만에 Llama 3.1 8B를 학습시켰으며, FLUX.1에 대한 결과를 제출한 유일한 플랫폼으로서 1,152개의 Blackwell GPU로 12.5분의 학습 시간을 달성했습니다.​


다양한 경쟁 분야

MLPerf Training v5.1 라운드에는 20개 조직이 참여하여 12개의 서로 다른 하드웨어 가속기를 탑재한 65개의 고유한 시스템을 제출했습니다. AMD는 새로운 Instinct MI355X 및 MI350X GPU를 선보였으며, AMD는 단일 노드 접근성을 위해 설계된 새로운 Llama 3.1 8B 벤치마크 개발을 주도했습니다. AMD에 따르면, MI355X GPU 성능은 Llama 3.1 8B 테스트에서 NVIDIA의 Blackwell 플랫폼 대비 5-6% 이내의 차이를 보였습니다.​

전체 제출물의 거의 절반이 멀티 노드 구성이었으며, 이는 전년도 라운드 대비 86% 증가한 수치입니다. Datacrunch, University of Florida, Wiwynn이 처음으로 참여했으며, Dell, HPE, Lenovo와 같은 기존 참가자들도 함께했습니다.​

벤치마크 업데이트에서는 레거시 테스트를 최신 AI 워크로드로 대체했습니다: 언어 모델의 경우 BERT를 Llama 3.1 8B로, 이미지 생성의 경우 Stable Diffusion v2를 FLUX.1로 교체했습니다.

댓글 0
전체 1,366 / 24 페이지
Pendo의 수석 제품 디자이너인 Brian Greenbaum은 육아휴직 중 보낸 단 하나의 Slack 메시지로 회사 전체의 변화를 촉발시킨 후, 전체 제품 조직에 걸쳐 AI 도입을 이끌어내기 위한 실용적인 플레이북을 공유합니다.lennysnewsletter​ 그의 접근 방식은 동기식 실습 워크숍과 비동기식 학습 기회를 결합했으며, 법무, 보안, 재무 팀과 협력하여 명확한 정책을 수립함으로써 AI 도구 사용을 위한 "황금 경로"를 확립했습니다.lennysnewsletter​ 이 이니셔티브는 Greenbaum의 개인 기여자 역할을 넘어 그의 경력을 변화시켰으며, 회사 전략에 영향을 미치고 조직의 AI 챔피언으로 자리매김할 수 있는 기회를 열어주었습니다—이는 AI 도입을 주도하는 것이 어떻게 중요한 경력 가속기 역할을 할 수 있는지를 보여줍니다.lennysnewsletter​ https://www.lennysnewsletter.com/p/how-to-get-your-whole-team-excited https://www.lennysnewsletter.com/p/this-week-on-how-i-ai-how-to-get
606 조회
0 추천
2025.12.26 등록
Nate's Newsletter는 Claude Code가 오해의 소지가 있는 이름이라고 주장하는데, Anthropic의 12월 릴리스는 소프트웨어 개발이 아니라 브라우저 자동화, Slack 통합, 모바일 위임, 그리고 비기술 사용자들이 코드 작성 없이 활용할 수 있는 조직 워크플로우 도구에 초점을 맞췄기 때문이다.natesnewsletter.substack​ 이 가이드는 29페이지의 설정 지침, 양식 작성, 경쟁 조사, 회의 처리, 파일 정리를 포함한 10가지 단계별 프로덕션 워크플로우, 그리고 완전한 자율 위임이 아닌 빈번한 체크포인트를 통한 반복적 협업을 통해 Claude에게 작업을 위임하는 프레임워크를 제공한다.natesnewsletter.substack​ Anthropic의 내부 연구에 따르면 사용자들은 Claude로 업무의 60%를 완료하고 50%의 생산성 향상을 달성하며, Claude Code는 2025년 5월 공개 출시 후 단 6개월 만에 연간 10억 달러의 수익을 달성했다.venturebeat+1​ https://natesnewsletter.substack.com/p/the-complete-wait-i-can-use-claude https://venturebeat.com/ai/anthropics-claude-code-can-now-read-your-slack-messages-and-write-code-for https://simonwillison.net/2025/Oct/20/claude-code-for-web/ https://x.com/DanielMiessler/status/2002485123040817525 https://www.gend.co/blog/automate-code-sessions-with-claude-in-slack https://en.wikipedia.org/wiki/Claude_(language_model) https://code.claude.com/docs/en/slack https://techcrunch.com/2025/10/20/anthropic-brings-claude-code-to-the-web/ https://x.com/mattyglesias/status/2002388080460812420 https://www.codegpt.co/blog/anthropic-claude-models-complete-guide https://x.com/simonw/status/2002416381980213307 https://www.salesforce.com/news/stories/claude-code-in-slack/ https://www.datastudios.org/post/all-claude-ai-models-available-in-2025-full-list-for-web-app-api-and-cloud-platforms https://bsky.app/profile/mattyglesias.bsky.social https://www.reddit.com/r/ClaudeCode/comments/1phuzfs/claude_code_in_slack_signals_shift_to/ https://www.anthropic.com/claude/sonnet https://x.com/LBacaj/status/2002446302744097050 https://n8n.io/integrations/claude/and/slack/ https://support.claude.com/en/articles/12138966-release-notes https://www.slowboring.com/p/mailbag-more-philosophical-than-usual https://vertu.com/lifestyle/the-ai-model-race-reaches-singularity-speed/ https://claude-plugins.dev/skills/@greyhaven-ai/claude-code-config/browser-automation https://claude-plugins.dev/skills/@chriscarterux/chris-claude-stack/effective-delegation-patterns https://newsroom.accenture.com/news/2025/accenture-and-anthropic-launch-multi-year-partnership-to-drive-enterprise-ai-innovation-and-value-across-industries https://www.datacamp.com/tutorial/claude-for-chrome-ai-powered-browser-assistance-automation https://claude-plugins.dev/skills/@rsmdt/the-startup/agent-delegation https://www.youtube.com/watch?v=4ue4CNt8YxE https://code.claude.com/docs/en/chrome https://www.youtube.com/watch?v=0J2_YGuNrDo https://www.anthropic.com/news https://github.com/SawyerHood/dev-browser https://www.youtube.com/watch?v=oZF6TgxB5yw https://www.snowflake.com/en/news/press-releases/snowflake-and-anthropic-announce-200-million-partnership-to-bring-agentic-ai-to-global-enterprises/ https://www.reddit.com/r/ClaudeAI/comments/1prcypb/anthropic_just_dropped_claude_for_chrome_ai_that/ https://claude.ai/public/artifacts/7029f156-12d7-4680-9df4-5af4715e0612 https://www.anthropic.com/news/snowflake-anthropic-expanded-partnership https://www.youtube.com/watch?v=XYzs8JJAL24 https://www.reddit.com/r/ClaudeAI/comments/1obq6wq/understanding_claude_skills_vs_subagents_its_not/ https://techcrunch.com/2025/12/04/anthropic-signs-200m-deal-to-bring-its-llms-to-snowflakes-customers/ https://www.anthropic.com/engineering/claude-code-best-practices
697 조회
0 추천
2025.12.26 등록
Meta의 퇴임하는 수석 AI 과학자이자 튜링상 수상자인 Yann LeCun은 AI 팟캐스트 "The Information Bottleneck"에서 "일반 지능"이라는 개념을 "완전한 헛소리"라고 선언했으며, 이에 Google DeepMind CEO Demis Hassabis가 X에서 LeCun이 "명백히 틀렸다"며 일반 지능과 보편 지능을 혼동하고 있다고 공개적으로 반박했다.the-decoder​LeCun은 인간의 지능이 일반적이라기보다는 고도로 특화되어 있으며—우리가 이해할 수 없는 문제를 상상할 수 없기 때문에 생긴 착각이라고 주장하는 반면, Hassabis는 뇌와 AI 기반 모델이 충분한 시간, 메모리, 데이터가 주어지면 계산 가능한 모든 것을 학습할 수 있는 근사 튜링 머신으로 기능한다고 반박한다.the-decoder+1​이 공개적인 의견 충돌은 DeepMind가 인공 일반 지능 달성에 대한 자신감이 커지고 있음을 보여주며, 공동 창립자 Shane Legg는 12월 중순 회사 공식 팟캐스트에서 많은 인간 인지 작업을 처리할 수 있는 "최소한의 AGI" 형태가 이르면 2028년에 도래할 수 있다고 밝혔다.the-decoder​youtube​https://the-decoder.com/yann-lecun-calls-general-intelligence-complete-bs-and-deepmind-ceo-hassabis-fires-back-publicly/https://www.the-information-bottleneck.com/ep20-yann-lecun/https://www.youtube.com/watch?v=l3u_FAv33G0
614 조회
0 추천
2025.12.26 등록
2025년 말, 음악 산업의 지형도를 뒤흔드는 상징적인 사건이 발생했습니다. 세계적인 거대 레이블 워너 뮤직 그룹(WMG)이 생성형 AI 음악 플랫폼 수노(Suno)와 극적인 합의에 도달하며, 적대적 소송 관계를 끝내고 공식적인 파트너십을 체결한 것입니다. 이번 합의는 기술적 혁신과 저작권 보호라는 팽팽한 갈등 사이에서 음악 산업이 나아갈 새로운 공존의 길을 제시하고 있습니다.이번 파트너십의 핵심은 아티스트의 권리를 철저히 보장하는 ‘선택적 참여(Opt-in)’ 모델에 있습니다. 과거 AI 기업들이 저작물을 무단으로 학습시키며 비판을 받았던 것과 달리, 이제 워너 뮤직 소속 아티스트들은 자신의 목소리와 음악적 자산을 AI 학습에 제공할지 여부를 스스로 결정하게 됩니다. 이는 아티스트의 고유한 정체성을 데이터 자산으로 인정하고, 그 활용 과정에서 발생하는 수익을 정당하게 배분하겠다는 의지의 표명입니다.수노는 이번 합의를 기점으로 단순한 생성 도구를 넘어 종합적인 음악 생태계로의 진화를 꾀하고 있습니다. 특히 공연 정보 플랫폼 ‘송킥(Songkick)’을 인수하며 온라인의 AI 창작물과 오프라인의 라이브 공연 경험을 연결하려는 행보는 주목할 만합니다. 또한 무료 사용자의 무분별한 콘텐츠 생성을 제한하고 유료 모델을 강화함으로써, 이른바 ‘AI 슬롭(Slop)’이라 불리는 저품질 콘텐츠의 범람을 막고 시장의 질서를 잡으려는 노력도 병행하고 있습니다.이러한 변화는 음악 산업에 깊은 통찰을 던져줍니다. 무엇보다 이번 사건은 AI 기술의 흐름을 법적으로 막아설 수 없다는 현실을 인정한 레이블들이, 기술을 제도권 안으로 끌어들여 새로운 ‘라이선스 수익 모델’을 창출하는 실리를 택했음을 보여줍니다. 이제 음악은 완성된 결과물을 소비하는 단계를 넘어, 아티스트의 목소리와 스타일 자체가 거래되는 새로운 가치 사슬을 형성하게 되었습니다.결국 이번 합의는 AI가 음악적 영감을 훼손하는 위협이 아니라, 팬들이 아티스트의 자산을 활용해 상호작용할 수 있는 새로운 창작의 도구가 될 수 있음을 시사합니다. 기술의 풍요로움이 인간의 창의성과 결합하여 음악 산업의 가치를 높일 수 있을지, 아니면 단순한 상업적 도구로 전락할지는 향후 구축될 투명한 보상 체계와 윤리적 운영에 달려 있습니다.
599 조회
0 추천
2025.12.26 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입