Loading...

AI 뉴스

AI 기업, AMD 칩으로만 최초의 대규모 모델 훈련 완료

페이지 정보

작성자 xtalfi
작성일 2025.11.25 16:00
595 조회
0 추천
0 비추천

본문

data-center-1.jpg

샌프란시스코에 기반을 둔 AI 연구 기업 자이프라(Zyphra)는 일요일, 자사가 최초로 대규모 Mixture-of-Experts(전문가 혼합) 기반 파운데이션 모델인 ZAYA1을 완전히 AMD 하드웨어에서 학습시키는 데 성공했다고 발표했습니다. 이는 AI 모델 학습 분야에서 NVIDIA의 지배에 도전하는 중요한 이정표로 평가받고 있습니다.

이 모델은 AMD Instinct MI300X GPU 및 AMD Pensando 네트워킹, IBM 클라우드 인프라에서 학습을 진행했으며, NVIDIA의 플랫폼 외에도 최첨단 AI 개발을 충분히 감당할 수 있다는 점을 입증했습니다. 총 83억 개의 파라미터에 활성 파라미터는 7억 6천만 개만 사용했음에도 불구하고, ZAYA1은 Meta의 Llama-3-8B, Alibaba의 Qwen3-4B, Google의 Gemma3-12B 등 더 큰 모델들과 견주거나 더 나은 성능을 추론, 수학, 코딩 벤치마크에서 보였습니다.​


기술적 돌파구가 AMD의 AI 역량을 입증하다

이 성과는 AMD 플랫폼의 여러 기술적 장점을 보여줍니다. MI300X GPU의 192GB 고대역폭 메모리는 비용이 많이 드는 전문가 샤딩이나 텐서 샤딩 없이 효율적인 대규모 학습을 가능하게 하여 개발 프로세스를 간소화했습니다. Zyphra는 AMD 최적화 분산 I/O를 사용하여 10배 이상 빠른 모델 저장 시간을 달성했으며, 이를 통해 학습 신뢰성과 효율성을 향상시켰다고 보고했습니다.​

Zyphra의 CEO인 Krithik Puthalath는 "ZAYA1은 이러한 철학을 반영하며, AMD 플랫폼에서 대규모 학습을 시연한 최초의 회사가 되어 기쁘게 생각합니다"라고 말했습니다. 이번 협력은 10월에 발표된 IBM과 AMD 간의 다년간 계약을 기반으로 하며, Zyphra에 고급 AI 인프라를 제공하기 위한 것입니다.​


AI 하드웨어 시장에 대한 경쟁적 시사점

성공적인 훈련은 현재 NVIDIA가 지배하고 있는 AI 인프라 시장에서 더 많은 점유율을 확보하려는 AMD의 중요한 과제를 해결합니다. AMD는 AI 훈련 GPU 시장에서 NVIDIA에 비해 약 94%의 시장 점유율 열세를 보이고 있지만, 향후 3~5년 동안 데이터 센터 AI 사업이 연평균 60% 이상의 성장률을 기록할 것으로 전망하고 있습니다.​​

Mixture-of-Experts 아키텍처는 OpenAI의 GPT-5, Anthropic의 Claude-4.5, DeepSeek-V3를 포함한 현대 최첨단 AI 시스템의 기본 설계가 되었습니다. 이러한 모델은 동적으로 활성화되는 전문화된 전문가 네트워크를 사용하여 기존의 밀집 아키텍처보다 더 큰 효율성과 확장성을 제공합니다.​

AMD의 수석 부사장 겸 최고 상업 책임자인 Philip Guido는 "이 이정표는 혁신적인 AMD 하드웨어 및 소프트웨어 솔루션이 업계 선두 기업들과 함께 차세대 최첨단 AI 개발을 가능하게 하고 있음을 강조합니다"라고 말했습니다.

댓글 0
전체 1,366 / 42 페이지
• Apple은 월요일 기계 학습 및 AI 전략 담당 수석 부사장인 John Giannandrea가 2026년 봄에 물러나 은퇴할 것이며, Microsoft와 Google에서 근무한 Amar Subramanya가 AI 담당 부사장으로 합류할 것이라고 발표했습니다.[investing +2]• 이번 리더십 개편은 Apple이 AI 강화 Siri 어시스턴트 출시 지연으로 비판을 받고 있는 가운데 이루어졌습니다. Siri는 원래 2024년에 약속되었으나 이제 2026년으로 연기되었으며, 회사는 생성형 AI 경쟁에서 OpenAI, Google, Microsoft와 같은 경쟁사들을 따라잡기 위해 고군분투하고 있습니다.[investing +2]• CEO Tim Cook에게 직접 보고했던 Giannandrea와 달리, Subramanya는 소프트웨어 책임자인 Craig Federighi에게 보고할 예정입니다. Federighi의 AI 책임은 확대되어 “내년에 사용자들에게 더 개인화된 Siri를 제공”하기 위한 Apple의 노력을 감독하게 된다고 Cook이 말했습니다.[nbcnews +2]
483 조회
0 추천
2025.12.02 등록
• Nvidia는 NeurIPS 컨퍼런스에서 Alpamayo-R1을 공개했으며, 이는 사고 연쇄(chain-of-thought) AI 추론과 경로 계획을 통합하여 자율주행 자동차가 실시간으로 자신의 결정을 설명할 수 있도록 하는 세계 최초의 개방형 산업 규모 추론 비전 언어 행동 모델로 설명되었습니다.[quantumzeitgeist +1]• 이 모델은 센서 데이터를 자연어 설명으로 변환하고 주행 결정을 단계별로 추론함으로써 자율주행 차량 소프트웨어의 “블랙박스” 문제를 해결하며, 강화 학습 후처리 후 추론 품질이 45% 향상되었습니다.[quantumzeitgeist +1]• Nvidia는 비상업적 연구 용도로 GitHub와 Hugging Face에 이 모델을 공개했으며, 개발자들이 자율주행 차량 및 로봇공학을 위한 물리적 AI 모델을 맞춤화할 수 있도록 Cosmos Cookbook과 AlpaSim 평가 프레임워크도 함께 제공했습니다.[quantumzeitgeist +1]
503 조회
0 추천
2025.12.02 등록
Runway는 월요일에 Gen 4.5를 공개했으며, 이는 독립 벤치마킹 업체 Artificial Analysis가 관리하는 Video Arena 리더보드에서 1위를 차지한 새로운 AI 비디오 생성 모델로, 2위인 Google의 Veo 3 모델과 7위인 OpenAI의 Sora 2 Pro를 능가했다.PitchBook에 따르면 35억 5천만 달러의 가치를 평가받은 이 100명 규모의 스타트업은 블라인드 테스트를 사용하며, 투표자들이 어느 회사가 제작했는지 모르는 상태에서 비디오 결과물을 비교하여 순수한 사용자 선호도를 기반으로 편향되지 않은 순위를 보장한다.CEO Cristóbal Valenzuela는 CNBC에 Runway가 “100명의 팀으로 수조 달러 규모의 기업들을 능가하는 데 성공했다”고 말했으며, “David”라는 코드명의 이 모델은 주말까지 회사의 플랫폼, API 및 파트너 통합을 통해 모든 고객에게 제공될 예정이다.
473 조회
0 추천
2025.12.02 등록
Google은 12월 8일 오전 10시(태평양 표준시)에 30분간 라이브스트림을 개최하여 확장 현실 플랫폼인 Android XR의 업데이트를 공개할 예정이며, Gemini AI 통합이 적용된 헤드셋 및 스마트 안경의 새로운 기능에 중점을 둘 것입니다.이 행사는 10월에 출시된 Samsung의 Galaxy XR 헤드셋 출시에 이어 진행되는 것으로, 이는 1,799달러 가격의 첫 번째 Android XR 기기로서 4K 디스플레이와 손동작, 시선 추적, 음성 명령을 통한 AI 기반 상호작용을 특징으로 합니다.티저 자료에 따르면 Google은 2026년 출시 예정인 Samsung의 차기 스마트 안경을 선보일 가능성이 있으며, 이는 Apple의 부진한 Vision Pro 및 Meta의 보다 성공적인 Ray-Ban 스마트 안경과 경쟁하기 위한 것입니다.
479 조회
0 추천
2025.12.02 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입