Loading...

AI 뉴스

AI 기업, AMD 칩으로만 최초의 대규모 모델 훈련 완료

페이지 정보

작성자 xtalfi
작성일 2025.11.25 16:00
639 조회
0 추천
0 비추천

본문

data-center-1.jpg

샌프란시스코에 기반을 둔 AI 연구 기업 자이프라(Zyphra)는 일요일, 자사가 최초로 대규모 Mixture-of-Experts(전문가 혼합) 기반 파운데이션 모델인 ZAYA1을 완전히 AMD 하드웨어에서 학습시키는 데 성공했다고 발표했습니다. 이는 AI 모델 학습 분야에서 NVIDIA의 지배에 도전하는 중요한 이정표로 평가받고 있습니다.

이 모델은 AMD Instinct MI300X GPU 및 AMD Pensando 네트워킹, IBM 클라우드 인프라에서 학습을 진행했으며, NVIDIA의 플랫폼 외에도 최첨단 AI 개발을 충분히 감당할 수 있다는 점을 입증했습니다. 총 83억 개의 파라미터에 활성 파라미터는 7억 6천만 개만 사용했음에도 불구하고, ZAYA1은 Meta의 Llama-3-8B, Alibaba의 Qwen3-4B, Google의 Gemma3-12B 등 더 큰 모델들과 견주거나 더 나은 성능을 추론, 수학, 코딩 벤치마크에서 보였습니다.​


기술적 돌파구가 AMD의 AI 역량을 입증하다

이 성과는 AMD 플랫폼의 여러 기술적 장점을 보여줍니다. MI300X GPU의 192GB 고대역폭 메모리는 비용이 많이 드는 전문가 샤딩이나 텐서 샤딩 없이 효율적인 대규모 학습을 가능하게 하여 개발 프로세스를 간소화했습니다. Zyphra는 AMD 최적화 분산 I/O를 사용하여 10배 이상 빠른 모델 저장 시간을 달성했으며, 이를 통해 학습 신뢰성과 효율성을 향상시켰다고 보고했습니다.​

Zyphra의 CEO인 Krithik Puthalath는 "ZAYA1은 이러한 철학을 반영하며, AMD 플랫폼에서 대규모 학습을 시연한 최초의 회사가 되어 기쁘게 생각합니다"라고 말했습니다. 이번 협력은 10월에 발표된 IBM과 AMD 간의 다년간 계약을 기반으로 하며, Zyphra에 고급 AI 인프라를 제공하기 위한 것입니다.​


AI 하드웨어 시장에 대한 경쟁적 시사점

성공적인 훈련은 현재 NVIDIA가 지배하고 있는 AI 인프라 시장에서 더 많은 점유율을 확보하려는 AMD의 중요한 과제를 해결합니다. AMD는 AI 훈련 GPU 시장에서 NVIDIA에 비해 약 94%의 시장 점유율 열세를 보이고 있지만, 향후 3~5년 동안 데이터 센터 AI 사업이 연평균 60% 이상의 성장률을 기록할 것으로 전망하고 있습니다.​​

Mixture-of-Experts 아키텍처는 OpenAI의 GPT-5, Anthropic의 Claude-4.5, DeepSeek-V3를 포함한 현대 최첨단 AI 시스템의 기본 설계가 되었습니다. 이러한 모델은 동적으로 활성화되는 전문화된 전문가 네트워크를 사용하여 기존의 밀집 아키텍처보다 더 큰 효율성과 확장성을 제공합니다.​

AMD의 수석 부사장 겸 최고 상업 책임자인 Philip Guido는 "이 이정표는 혁신적인 AMD 하드웨어 및 소프트웨어 솔루션이 업계 선두 기업들과 함께 차세대 최첨단 AI 개발을 가능하게 하고 있음을 강조합니다"라고 말했습니다.

댓글 0
전체 1,366 / 24 페이지
• 아마존의 차세대 음성 비서 '알렉사 플러스'가 기존 에코 기기 사용자에게도 확대 적용• 프라임 회원은 "알렉사, 업그레이드"라고 말하면 알렉사 플러스로 전환 가능• 신형 에코 기기와 웹에서 순차적으로 출시 중이나, 과연 진정한 '업그레이드'인지는 의문아마존의 차세대 음성 비서가 서서히 보급되고 있다. 신형 에코 기기에 탑재되어 출시되고 있으며, 일부 사용자들에게는 웹을 통해서도 제공되고 있다. 이제 기존 에코 기기를 보유한 프라임 회원들도 "알렉사, 업그레이드"라고 말하면 알렉사 플러스를 이용할 수 있게 되었다. 다만 남은 질문은 하나다. 이것이 과연 진정한 업그레이드인가?
378 조회
0 추천
2025.12.22 등록
앤트로픽은AI에이전트가특정작업을효율적으로수행하도록돕는‘에이전트스킬’을오픈소스로공개하며기업용AI시장의표준선점에나섰습니다.이는에이전트가업무에필요한지침과리소스를동적으로불러와사용할수있도록지원하는기술적저장소역할을합니다.이기술은대형언어모델의한계인절차적지식부족을보완하며,필요한경우에만세부정보를로드하는방식을통해시스템의효율성을극대화했습니다.사용자는복잡한프롬프트작성없이도데이터분석이나문서작성같은전문워크플로우를모듈형태로간편하게재사용할수있습니다.아틀라시안과피그마등주요글로벌IT기업들이이미도입을시작했으며,이는개별맞춤형모델구축보다훨씬효율적인에이전트생태계를형성할것으로기대됩니다.앤트로픽은이번오픈소스화를통해기술주도권을확보하고,기업들이범용적으로사용할수있는AI에이전트환경을구축하는데집중하고있습니다.
400 조회
0 추천
2025.12.21 등록
MIT연구진은생성형AI를이용해에세이를쓸때인지처리와관련된뇌활동이줄어들고내용기억력도감퇴한다는연구결과를발표했습니다.뇌파검사결과AI도구에의존할수록뇌의활동량이적게나타났으며,이는학습능력감소로이어질수있다는우려를낳고있습니다.카네기멜론대와마이크로소프트의연구에따르면AI에대한신뢰도가높을수록사용자가비판적사고에들이는노력은오히려감소하는경향을보였습니다.이러한현상은업무효율을높일수는있지만,장기적으로는독립적인문제해결능력을약화시키고AI에과도하게의존하게만드는부작용을초래할수있습니다.전문가들은AI를무조건배척하기보다사용자가명확한목표를가지고결과물을직접검증하며비판적으로관여해야한다고강조합니다.AI가제공하는정보의추론방식과데이터처리과정을이해함으로써스스로정보에근거한결정을내리는능력을유지하는것이중요합니다.
385 조회
0 추천
2025.12.21 등록
철학자 Matthew Harris는 의식이 본질적으로 기질 의존적(substrate-dependent)이라고 주장한다—즉, 어떤 매체에서든 복제될 수 있는 계산적 패턴이라기보다는 특정한 생물학적 물질과 진화적 역사로부터 발생한다는 것이다.Harris는 인간의 의식이 호르몬 시스템, 감각 통합, 그리고 결정적으로 생각을 자아와 구별되는 것으로 인식할 수 있게 하는 메타인지적 자기 참조를 포함한 진화된 생물학적 과정들로부터 출현하며, 이는 AI에 의한 기능적 모방을 실제 주관적 경험과 근본적으로 다르게 만든다고 주장한다.이 논쟁은 심화되는 학계의 분열을 반영하고 있으며, Anil Seth와 같은 신경과학자들은 생물학적 기질에 연결된 체화된 예측적 처리를 강조하는 반면, David Chalmers와 같은 기능주의자들은 의식이 기질 독립적이라고 주장하고 있다. 연구자들은 급속한 AI 발전 속에서 의식에 대한 이해가 시급해졌다고 경고하고 있다.
386 조회
0 추천
2025.12.21 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입