Loading...

AI 뉴스

AI 기업, AMD 칩으로만 최초의 대규모 모델 훈련 완료

페이지 정보

작성자 xtalfi
작성일 2025.11.25 16:00
589 조회
0 추천
0 비추천

본문

data-center-1.jpg

샌프란시스코에 기반을 둔 AI 연구 기업 자이프라(Zyphra)는 일요일, 자사가 최초로 대규모 Mixture-of-Experts(전문가 혼합) 기반 파운데이션 모델인 ZAYA1을 완전히 AMD 하드웨어에서 학습시키는 데 성공했다고 발표했습니다. 이는 AI 모델 학습 분야에서 NVIDIA의 지배에 도전하는 중요한 이정표로 평가받고 있습니다.

이 모델은 AMD Instinct MI300X GPU 및 AMD Pensando 네트워킹, IBM 클라우드 인프라에서 학습을 진행했으며, NVIDIA의 플랫폼 외에도 최첨단 AI 개발을 충분히 감당할 수 있다는 점을 입증했습니다. 총 83억 개의 파라미터에 활성 파라미터는 7억 6천만 개만 사용했음에도 불구하고, ZAYA1은 Meta의 Llama-3-8B, Alibaba의 Qwen3-4B, Google의 Gemma3-12B 등 더 큰 모델들과 견주거나 더 나은 성능을 추론, 수학, 코딩 벤치마크에서 보였습니다.​


기술적 돌파구가 AMD의 AI 역량을 입증하다

이 성과는 AMD 플랫폼의 여러 기술적 장점을 보여줍니다. MI300X GPU의 192GB 고대역폭 메모리는 비용이 많이 드는 전문가 샤딩이나 텐서 샤딩 없이 효율적인 대규모 학습을 가능하게 하여 개발 프로세스를 간소화했습니다. Zyphra는 AMD 최적화 분산 I/O를 사용하여 10배 이상 빠른 모델 저장 시간을 달성했으며, 이를 통해 학습 신뢰성과 효율성을 향상시켰다고 보고했습니다.​

Zyphra의 CEO인 Krithik Puthalath는 "ZAYA1은 이러한 철학을 반영하며, AMD 플랫폼에서 대규모 학습을 시연한 최초의 회사가 되어 기쁘게 생각합니다"라고 말했습니다. 이번 협력은 10월에 발표된 IBM과 AMD 간의 다년간 계약을 기반으로 하며, Zyphra에 고급 AI 인프라를 제공하기 위한 것입니다.​


AI 하드웨어 시장에 대한 경쟁적 시사점

성공적인 훈련은 현재 NVIDIA가 지배하고 있는 AI 인프라 시장에서 더 많은 점유율을 확보하려는 AMD의 중요한 과제를 해결합니다. AMD는 AI 훈련 GPU 시장에서 NVIDIA에 비해 약 94%의 시장 점유율 열세를 보이고 있지만, 향후 3~5년 동안 데이터 센터 AI 사업이 연평균 60% 이상의 성장률을 기록할 것으로 전망하고 있습니다.​​

Mixture-of-Experts 아키텍처는 OpenAI의 GPT-5, Anthropic의 Claude-4.5, DeepSeek-V3를 포함한 현대 최첨단 AI 시스템의 기본 설계가 되었습니다. 이러한 모델은 동적으로 활성화되는 전문화된 전문가 네트워크를 사용하여 기존의 밀집 아키텍처보다 더 큰 효율성과 확장성을 제공합니다.​

AMD의 수석 부사장 겸 최고 상업 책임자인 Philip Guido는 "이 이정표는 혁신적인 AMD 하드웨어 및 소프트웨어 솔루션이 업계 선두 기업들과 함께 차세대 최첨단 AI 개발을 가능하게 하고 있음을 강조합니다"라고 말했습니다.

댓글 0
전체 1,366 / 43 페이지
Persistent Systems의 Dattaraj Rao는 VentureBeat에서 온톨로지(기업 맞춤형 개념, 계층 구조, 관계의 정의)가 AI 에이전트가 엔터프라이즈 데이터와 프로세스를 오해하지 않도록 필수적인 가드레일 역할을 한다고 주장합니다. 수십억 달러가 에이전트 인프라에 투자되었음에도 불구하고 실제 성공 사례는 제한적이라는 점을 지적합니다.기사에서는 엔터프라이즈 데이터의 단편화로 인해 중요한 모호성이 발생하는데, 예를 들어 “고객”이라는 단어가 Sales CRM에서는 한 종류의 사람을, 재무 시스템에서는 또 다른 종류의 사람을 의미할 수 있기 때문에, Neo4j와 같은 그래프 데이터베이스를 활용한 온톨로지 기반 접근 방식이 에이전트가 내장된 비즈니스 규칙을 따르면서 질의할 수 있는 통합된 진실의 원천을 마련해야 한다고 설명합니다.이러한 온톨로지 기반 아키텍처는 시급한 엔터프라이즈 과제를 해결합니다. AI의 환각(hallucination) 현상은 기업에게 큰 컴플라이언스와 의사결정 리스크를 야기할 수 있으며, 기술에 대한 관심이 빠르게 증가하고 있음에도 불구하고 실제로 에이전트 기반 AI 워크플로우를 성공적으로 확장한 기업은 11%에 불과하다고 밝혔습니다.
483 조회
0 추천
2025.12.01 등록
• ChatGPT는 11월 30일 3주년을 맞아 주간 활성 사용자 8억 명을 기록하며, 2022년 출시 이후 역사상 가장 빠르게 성장한 소비자 애플리케이션 중 하나가 되었습니다.[kmph +1]• Google의 Gemini 3 Pro는 11월 18일 출시되어 현재 벤치마크 리더보드 1위를 차지하고 있으며, 경쟁이 심화됨에 따라 OpenAI CEO Sam Altman이 직원들에게 “어려운 시기”와 “일시적인 경제적 장애물”에 대해 경고하게 만들었습니다.[axios +1]• Deakin University 연구에 따르면 ChatGPT는 학술 인용의 약 5분의 1을 조작했으며, 전체 인용의 56%가 가짜이거나 오류를 포함하고 있어 지속적인 정확성 문제를 부각시켰습니다.[studyfinds]
464 조회
0 추천
2025.12.01 등록
네이버클라우드가 전문 지식 없이도 사내 데이터 기반으로 맞춤형 AI 어시스턴트를 제작할 수 있는 ‘네이버웍스 AI 스튜디오’를 1일 출시했다고 밝혔다.이 도구는 메시지 검색, 보고서 작성 등 업무용 어시스턴트뿐 아니라 점심 메뉴 추천, MBTI 분석 등 창의적인 어시스턴트 제작도 가능하며, 메일 답장 제안과 드라이브 파일 번역 등 AI 기능도 대폭 강화됐다.네이버웍스는 일본에서 8년 연속 유료 비즈니스 챗 시장 1위를 차지했으며, 회의록 정리 시간을 2시간에서 30분으로 단축하는 등 업무 효율 70% 이상 개선 효과를 입증했다고 밝혔다.
482 조회
0 추천
2025.12.01 등록
SK텔레콤이 1일 AI 전화 서비스 ‘에이닷 전화’에 통화 중 보이스피싱을 실시간 탐지하는 ‘AI 보이스피싱 탐지’ 기능을 추가했다고 밝혔다.온디바이스 AI 기술로 통화 내용을 단말 내에서 분석해 의심 전화 발견 시 즉시 경고하며, 통화 데이터가 서버를 거치지 않아 정보 유출 우려가 없다고 회사 측은 설명했다.2025년 1~8월 보이스피싱 피해액이 8856억 원에 달해 전년 연간 피해액에 육박하는 등 피해가 급증하면서 보안 강화의 필요성이 커진 가운데 나온 조치다.
487 조회
0 추천
2025.12.01 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입