AI 뉴스

AI 기업, AMD 칩으로만 최초의 대규모 모델 훈련 완료

페이지 정보

작성자 xtalfi
작성일 2025.11.25 16:00
526 조회
0 추천
0 비추천

본문

data-center-1.jpg

샌프란시스코에 기반을 둔 AI 연구 기업 자이프라(Zyphra)는 일요일, 자사가 최초로 대규모 Mixture-of-Experts(전문가 혼합) 기반 파운데이션 모델인 ZAYA1을 완전히 AMD 하드웨어에서 학습시키는 데 성공했다고 발표했습니다. 이는 AI 모델 학습 분야에서 NVIDIA의 지배에 도전하는 중요한 이정표로 평가받고 있습니다.

이 모델은 AMD Instinct MI300X GPU 및 AMD Pensando 네트워킹, IBM 클라우드 인프라에서 학습을 진행했으며, NVIDIA의 플랫폼 외에도 최첨단 AI 개발을 충분히 감당할 수 있다는 점을 입증했습니다. 총 83억 개의 파라미터에 활성 파라미터는 7억 6천만 개만 사용했음에도 불구하고, ZAYA1은 Meta의 Llama-3-8B, Alibaba의 Qwen3-4B, Google의 Gemma3-12B 등 더 큰 모델들과 견주거나 더 나은 성능을 추론, 수학, 코딩 벤치마크에서 보였습니다.​


기술적 돌파구가 AMD의 AI 역량을 입증하다

이 성과는 AMD 플랫폼의 여러 기술적 장점을 보여줍니다. MI300X GPU의 192GB 고대역폭 메모리는 비용이 많이 드는 전문가 샤딩이나 텐서 샤딩 없이 효율적인 대규모 학습을 가능하게 하여 개발 프로세스를 간소화했습니다. Zyphra는 AMD 최적화 분산 I/O를 사용하여 10배 이상 빠른 모델 저장 시간을 달성했으며, 이를 통해 학습 신뢰성과 효율성을 향상시켰다고 보고했습니다.​

Zyphra의 CEO인 Krithik Puthalath는 "ZAYA1은 이러한 철학을 반영하며, AMD 플랫폼에서 대규모 학습을 시연한 최초의 회사가 되어 기쁘게 생각합니다"라고 말했습니다. 이번 협력은 10월에 발표된 IBM과 AMD 간의 다년간 계약을 기반으로 하며, Zyphra에 고급 AI 인프라를 제공하기 위한 것입니다.​


AI 하드웨어 시장에 대한 경쟁적 시사점

성공적인 훈련은 현재 NVIDIA가 지배하고 있는 AI 인프라 시장에서 더 많은 점유율을 확보하려는 AMD의 중요한 과제를 해결합니다. AMD는 AI 훈련 GPU 시장에서 NVIDIA에 비해 약 94%의 시장 점유율 열세를 보이고 있지만, 향후 3~5년 동안 데이터 센터 AI 사업이 연평균 60% 이상의 성장률을 기록할 것으로 전망하고 있습니다.​​

Mixture-of-Experts 아키텍처는 OpenAI의 GPT-5, Anthropic의 Claude-4.5, DeepSeek-V3를 포함한 현대 최첨단 AI 시스템의 기본 설계가 되었습니다. 이러한 모델은 동적으로 활성화되는 전문화된 전문가 네트워크를 사용하여 기존의 밀집 아키텍처보다 더 큰 효율성과 확장성을 제공합니다.​

AMD의 수석 부사장 겸 최고 상업 책임자인 Philip Guido는 "이 이정표는 혁신적인 AMD 하드웨어 및 소프트웨어 솔루션이 업계 선두 기업들과 함께 차세대 최첨단 AI 개발을 가능하게 하고 있음을 강조합니다"라고 말했습니다.

댓글 0
전체 1,366 / 63 페이지
샌프란시스코에기반을둔AI연구기업자이프라(Zyphra)는일요일,자사가최초로대규모Mixture-of-Experts(전문가혼합)기반파운데이션모델인ZAYA1을완전히AMD하드웨어에서학습시키는데성공했다고발표했습니다.이는AI모델학습분야에서NVIDIA의지배에도전하는중요한이정표로평가받고있습니다.이모델은AMDInstinctMI300XGPU및AMDPensando네트워킹,IBM클라우드인프라에서학습을진행했으며,NVIDIA의플랫폼외에도최첨단AI개발을충분히감당할수있다는점을입증했습니다.총83억개의파라미터에활성파라미터는7억6천만개만사용했음에도불구하고,ZAYA1은Meta의Llama-3-8B,Alibaba의Qwen3-4B,Google의Gemma3-12B등더큰모델들과견주거나더나은성능을추론,수학,코딩벤치마크에서보였습니다.​기술적돌파구가AMD의AI역량을입증하다이성과는AMD플랫폼의여러기술적장점을보여줍니다.MI300XGPU의192GB고대역폭메모리는비용이많이드는전문가샤딩이나텐서샤딩없이효율적인대규모학습을가능하게하여개발프로세스를간소화했습니다.Zyphra는AMD최적화분산I/O를사용하여10배이상빠른모델저장시간을달성했으며,이를통해학습신뢰성과효율성을향상시켰다고보고했습니다.​Zyphra의CEO인KrithikPuthalath는"ZAYA1은이러한철학을반영하며,AMD플랫폼에서대규모학습을시연한최초의회사가되어기쁘게생각합니다"라고말했습니다.이번협력은10월에발표된IBM과AMD간의다년간계약을기반으로하며,Zyphra에고급AI인프라를제공하기위한것입니다.​AI하드웨어시장에대한경쟁적시사점성공적인훈련은현재NVIDIA가지배하고있는AI인프라시장에서더많은점유율을확보하려는AMD의중요한과제를해결합니다.AMD는AI훈련GPU시장에서NVIDIA에비해약94%의시장점유율열세를보이고있지만,향후3~5년동안데이터센터AI사업이연평균60%이상의성장률을기록할것으로전망하고있습니다.​​Mixture-of-Experts아키텍처는OpenAI의GPT-5,Anthropic의Claude-4.5,DeepSeek-V3를포함한현대최첨단AI시스템의기본설계가되었습니다.이러한모델은동적으로활성화되는전문화된전문가네트워크를사용하여기존의밀집아키텍처보다더큰효율성과확장성을제공합니다.​AMD의수석부사장겸최고상업책임자인PhilipGuido는"이이정표는혁신적인AMD하드웨어및소프트웨어솔루션이업계선두기업들과함께차세대최첨단AI개발을가능하게하고있음을강조합니다"라고말했습니다.
527 조회
0 추천
2025.11.25 등록
도널드트럼프미국대통령이24일(현지시간)인공지능개발을가속화하는대규모국가프로젝트'제네시스미션(GenesisMission)'출범을위한행정명령에서명했다.백악관은이번이니셔티브를아폴로프로그램이후연방과학자원의최대동원이라고평가하며,맨해튼프로젝트에필적하는긴급성과야망을가진국가적노력이라고강조했다.​마이클크라치오스백악관과학기술정책실장은기자들에게"제네시스미션은아폴로프로그램이후연방과학자원의최대동원"이라고밝혔다.그는"방대한연방데이터세트,첨단슈퍼컴퓨팅성능,세계적수준의과학시설을결합함으로써제네시스미션은AI를활용해실험설계를자동화하고,시뮬레이션을가속하며,단백질접힘부터핵융합플라스마역학에이르기까지모든분야를위한예측모델을만들어낼것"이라고설명했다.​에너지부주도로통합AI플랫폼구축행정명령은에너지부장관크리스라이트에게17개국립연구소의슈퍼컴퓨터와연방과학데이터세트를활용한통합AI플랫폼구축을지시한다.이플랫폼은과학기초모델을훈련하고,새로운가설을검증하며,연구흐름을자동화하는AI에이전트를창출할예정이다.​백악관은엔비디아,델,AMD,HPE,오라클등주요기업들과의협력을통해슈퍼컴퓨팅역량을강화할계획이다.에너지부는최근아르곤국립연구소에엔비디아블랙웰GPU10만개를탑재한'솔스티스'시스템을포함해여러대의새로운AI슈퍼컴퓨터구축을발표했다.​중국과의AI경쟁대응트럼프대통령은행정명령에서"오늘날미국은과학적발견과경제성장의가장중요한최첨단영역인AI개발분야에서글로벌기술주도권경쟁을벌이고있다"고강조했다.그는"이중대한순간에우리가직면한도전은2차세계대전에서우리가승리하는데중요했던맨해튼프로젝트의긴급성과야망에비교할만한역사적인국가적노력을요구한다"고말했다.​라이트에너지부장관은"AI경쟁에서승리하려면미국기술과과학이제공하는가장뛰어난인재와산업을하나로모으는혁신적인파트너십이필요하다"고밝혔다.제네시스미션은질병치료,에너지,국가안보를포함한다양한분야에서과학적발견을극적으로가속화하는것을목표로한다.크라치오스실장은이를통해"발견타임라인을수년에서수일또는수시간으로단축"할수있을것이라고전망했다.
514 조회
0 추천
2025.11.25 등록
Alphabet가MetaPlatforms와Meta의데이터센터에맞춤형AI칩을공급하는수십억달러규모의계약을논의중이라고TheInformation이월요일저녁보도했습니다.이는구글이AI인프라시장에서엔비디아의지배력에도전하는전략적변화를의미합니다.​제안된협약에따르면Meta는2027년부터자사시설에구글의텐서프로세싱유닛(TPU)을도입할예정이며,이르면내년부터구글클라우드에서TPU용량을임대받을계획입니다.이번거래는구글이기존에GoogleCloudPlatform을통한클라우드임대에만독점적으로TPU를제공해온오랜방침에서크게벗어난것이라할수있습니다이소식이발표된후,알파벳의주가는월요일장마감후시간외거래에서2.1%에서2.5%상승한반면,엔비디아의주가는1.8%하락했습니다.주가변동은알파벳이최근새롭게출시한Gemini3AI모델의긍정적인반응에힘입어정규장거래에서이미6%이상급등한직후에나타났습니다.​AI칩시장의전략적변화Google은Meta를비롯하여고빈도거래회사와주요금융기관등다양한잠재고객들에게TPU를적극적으로제안하고있으며,온프레미스배포가조직의엄격한보안및규정준수요구사항을충족하는데도움이될수있다고강조하고있습니다.Meta는현재자사애플리케이션전반에걸쳐매일30억명이상의사용자에게서비스를제공하는대규模AI인프라를구동하기위해주로NvidiaGPU에의존하고있습니다.​GoogleCloud경영진은TPU채택확대를통해Nvidia의연간매출의최대10%를확보할수있으며,이는수십억달러의잠재적이익을의미한다고믿고있습니다.이러한추진은AI컴퓨팅에대한글로벌수요가계속급증하고업계전반에걸쳐공급제약이지속되고있는상황에서이루어지고있습니다.​심화되는경쟁잠재적인Meta거래는맞춤형AI칩에대한Google의10년간의투자를입증할것입니다.Google은최근7세대TPU인Ironwood를출시했으며,이는이전세대보다4배의성능을제공하고2018년첫번째CloudTPU보다거의30배더에너지효율적이라고회사는주장합니다.​10월에Anthropic은수백억달러규모의거래에서Google의TPU최대100만개에액세스하기로약속했습니다.이AI스타트업은TPU의"가격대비성능및효율성"을결정의주요요인으로꼽았습니다.Google은TPU설계및제조를위해Broadcom과파트너십을맺고있으며,Broadcom의주가는월요일Google의AI모멘텀에대한긍정적인sentiment을반영하여10%급등했습니다.
489 조회
0 추천
2025.11.25 등록
Anthropic은월요일에ClaudeOpus4.5를출시하며,코딩,자율에이전트,사무생산성분야에서향상된기능을갖춘Claude4.5모델패밀리를완성했다.Amazon과Alphabet의지원을받는이AI스타트업은새로운플래그십모델을Google과OpenAI의최근출시제품에대한직접적인경쟁자로포지셔닝했다.​이모델은실제소프트웨어엔지니어링작업을위한벤치마크인SWE-benchVerified에서80.9%를달성하여,Google의Gemini3Pro(76.2%)와OpenAI의GPT-5.1CodexMax(77.9%)를능가했다.Anthropic의개발자관계책임자인AlexAlbert는BusinessInsider에이모델이"우리가정말로중요하게생각하는분야에서세계에서가장지능적인모델"을대표한다고말했다.​향상된직장역량ClaudeOpus4.5는확장된대화에서맥락을유지하는"무한채팅"과개발자가응답품질과토큰효율성의균형을맞출수있는새로운"노력매개변수"를포함하여기업사용자를대상으로하는여러기능을도입했습니다.Anthropic에따르면,중간노력수준에서이모델은ClaudeSonnet4.5의성능과일치하면서도출력토큰을76%적게사용합니다.​이번릴리스에는MicrosoftExcel및Chrome과의통합이포함되어있어AI가스프레드시트를분석하고브라우저기반작업을자동화할수있습니다.초기고객들은재무모델링에서20%의정확도향상과복잡한작업에서15%의효율성증가를보고했습니다.​시장경쟁이심화된다이번출시는지난주Google의Gemini3출시와이달초OpenAI의GPT-5.1데뷔에이어이루어졌습니다.MenloVentures의2025년중반보고서에따르면,Anthropic은기업AI시장의32%를점유하여OpenAI의25%점유율을추월했습니다.회사의시장점유율은2023년12%에서상승했으며,같은기간OpenAI는50%에서하락했습니다.​Amazon은Anthropic에80억달러를투자했으며,Google은20억달러를투입했습니다.두회사모두최근분기실적에서Anthropic지분으로인한수십억달러의미실현이익을보고했으며,Amazon은95억달러의세전이익을,Alphabet은이투자로인한지분증권에서107억달러의순이익을인식했습니다.​ClaudeOpus4.5는월$17부터시작하는Pro사용자,월$100의Max사용자,그리고Enterprise고객에게제공됩니다.이모델은GitHubCopilot과도통합되어있으며프로모션기간동안코딩에이전트의기본모델로제공될예정입니다.
475 조회
0 추천
2025.11.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입