Loading...

AI 뉴스

AI 기업, AMD 칩으로만 최초의 대규모 모델 훈련 완료

페이지 정보

작성자 xtalfi
작성일 2025.11.25 16:00
546 조회
0 추천
0 비추천

본문

data-center-1.jpg

샌프란시스코에 기반을 둔 AI 연구 기업 자이프라(Zyphra)는 일요일, 자사가 최초로 대규모 Mixture-of-Experts(전문가 혼합) 기반 파운데이션 모델인 ZAYA1을 완전히 AMD 하드웨어에서 학습시키는 데 성공했다고 발표했습니다. 이는 AI 모델 학습 분야에서 NVIDIA의 지배에 도전하는 중요한 이정표로 평가받고 있습니다.

이 모델은 AMD Instinct MI300X GPU 및 AMD Pensando 네트워킹, IBM 클라우드 인프라에서 학습을 진행했으며, NVIDIA의 플랫폼 외에도 최첨단 AI 개발을 충분히 감당할 수 있다는 점을 입증했습니다. 총 83억 개의 파라미터에 활성 파라미터는 7억 6천만 개만 사용했음에도 불구하고, ZAYA1은 Meta의 Llama-3-8B, Alibaba의 Qwen3-4B, Google의 Gemma3-12B 등 더 큰 모델들과 견주거나 더 나은 성능을 추론, 수학, 코딩 벤치마크에서 보였습니다.​


기술적 돌파구가 AMD의 AI 역량을 입증하다

이 성과는 AMD 플랫폼의 여러 기술적 장점을 보여줍니다. MI300X GPU의 192GB 고대역폭 메모리는 비용이 많이 드는 전문가 샤딩이나 텐서 샤딩 없이 효율적인 대규모 학습을 가능하게 하여 개발 프로세스를 간소화했습니다. Zyphra는 AMD 최적화 분산 I/O를 사용하여 10배 이상 빠른 모델 저장 시간을 달성했으며, 이를 통해 학습 신뢰성과 효율성을 향상시켰다고 보고했습니다.​

Zyphra의 CEO인 Krithik Puthalath는 "ZAYA1은 이러한 철학을 반영하며, AMD 플랫폼에서 대규모 학습을 시연한 최초의 회사가 되어 기쁘게 생각합니다"라고 말했습니다. 이번 협력은 10월에 발표된 IBM과 AMD 간의 다년간 계약을 기반으로 하며, Zyphra에 고급 AI 인프라를 제공하기 위한 것입니다.​


AI 하드웨어 시장에 대한 경쟁적 시사점

성공적인 훈련은 현재 NVIDIA가 지배하고 있는 AI 인프라 시장에서 더 많은 점유율을 확보하려는 AMD의 중요한 과제를 해결합니다. AMD는 AI 훈련 GPU 시장에서 NVIDIA에 비해 약 94%의 시장 점유율 열세를 보이고 있지만, 향후 3~5년 동안 데이터 센터 AI 사업이 연평균 60% 이상의 성장률을 기록할 것으로 전망하고 있습니다.​​

Mixture-of-Experts 아키텍처는 OpenAI의 GPT-5, Anthropic의 Claude-4.5, DeepSeek-V3를 포함한 현대 최첨단 AI 시스템의 기본 설계가 되었습니다. 이러한 모델은 동적으로 활성화되는 전문화된 전문가 네트워크를 사용하여 기존의 밀집 아키텍처보다 더 큰 효율성과 확장성을 제공합니다.​

AMD의 수석 부사장 겸 최고 상업 책임자인 Philip Guido는 "이 이정표는 혁신적인 AMD 하드웨어 및 소프트웨어 솔루션이 업계 선두 기업들과 함께 차세대 최첨단 AI 개발을 가능하게 하고 있음을 강조합니다"라고 말했습니다.

댓글 0
전체 1,366 / 2 페이지
Executive Summary• OpenAI가 전 CTO 미라 무라티(Mira Murati)의 AI 스타트업 '씽킹 머신스 랩(Thinking Machines Lab)'에서 공동 창업자 바렛 조프(Barret Zoph)와 루크 메츠(Luke Metz) 등 핵심 인력을 재영입• 씽킹 머신스 측은 조프가 심각한 비위 행위를 저질렀다고 주장하며, 기밀 정보 유출 가능성까지 제기한 상황• OpenAI는 이번 영입이 수주 전부터 진행된 것이라고 해명하며, 조프의 윤리성에 대한 씽킹 머신스의 우려를 공유하지 않는다고 밝혀Background조프와 메츠는 2024년 말 OpenAI를 떠나 무라티가 설립한 씽킹 머신스 랩에 합류했다가, 불과 수개월 만에 다시 OpenAI로 복귀하게 됐다. 이번 사건은 2023년 샘 알트먼(Sam Altman) CEO의 일시 해임 사태 이후 계속되는 AI 업계의 격변을 보여주는 단적인 예다.Impact & ImplicationsAI 인재 시장의 과열AI 연구원들이 수십억 달러 규모의 시드 라운드를 손쉽게 유치할 수 있는 현 상황에서, 인재 쟁탈전은 더욱 치열해질 전망이다. xAI의 이고르 바부슈킨(Igor Babuschkin), Safe Superintelligence의 다니엘 그로스(Daniel Gross), Meta의 얀 르쿤(Yann LeCun) 등 주요 AI 연구소 공동 창업자들의 이탈이 잇따르고 있으며, 이번 사건도 같은 맥락에서 이해할 수 있다.기업 비밀과 인재 이동의 충돌씽킹 머신스 측이 기밀 정보 유출 가능성을 제기한 점은 AI 스타트업 간 인재 이동에서 발생할 수 있는 법적·윤리적 문제를 부각시킨다. 이는 향후 AI 기업들이 핵심 인력의 경쟁사 이직을 막기 위한 계약 조항을 강화할 가능성을 시사한다.AI 에이전트 개발 경쟁 심화기사에 따르면 AI 연구소들은 맥킨지 컨설턴트, 골드만삭스 뱅커, 하버드 의사 등 전문가들의 실제 업무 데이터를 활용해 AI 에이전트를 훈련시키고 있다. 이러한 '환경(environments)' 구축을 통해 AI가 실제 업무 소프트웨어를 학습하도록 하는 방식이 확산되고 있으며, 이는 향후 지식 노동의 AI 자동화를 가속화할 것으로 예상된다.Key Data & Facts항목수치/내용복귀 인원바렛 조프, 루크 메츠, 샘 쇤홀츠 + 추가 2명 예정조프의 이전 직책씽킹 머신스 랩 공동 창업자AI 데이터 계약 시급시간당 최대 $100 이상주요 데이터 공급업체Handshake, Mercor, Surge, TuringKey Quote"지난 1년간 AI 연구소들은 법률, 의료, 컨설팅, 금융 등 다양한 지식 노동 영역에서 모델을 훈련하고 미세 조정해야 한다는 점을 점점 더 인식하게 됐습니다."— 아론 레비(Aaron Levie), Box CEO
77 조회
0 추천
01.20 등록
Executive Summary• 앤트로픽이 개발자용 Claude Code를 비기술 사용자도 쉽게 사용할 수 있도록 만든 새로운 AI 에이전트 'Cowork' 베타 출시• 파일 정리, 형식 변환, 이메일 관리, 웹 검색 등 기본적인 컴퓨터 작업을 자동화하는 데 초점• 월 100달러 구독자 대상 연구 프리뷰로 공개, 현재 Mac 전용으로 제공• 프롬프트 인젝션 공격 등 보안 위험에 대비해 가상 머신 기반 샌드박스, 폴더별 접근 권한 설정 등 다중 안전장치 적용• 실사용 테스트에서 스크린샷 폴더 정리, Gmail 정리 등 기본 작업에서 안정적인 성능 확인Background지난해 앤트로픽의 Claude Code는 개발자들 사이에서 코드베이스 이해와 명령 실행 능력으로 큰 인기를 얻었다. 하지만 대부분의 일반 사용자에게 터미널 기반 인터페이스는 여전히 진입장벽이 높았다. 이에 앤트로픽은 비기술 사용자를 위한 접근성 높은 버전 개발에 착수했으며, 2개월간 AI 도구를 활용해 Cowork를 구축했다.Impact & Implications기술적 의미Cowork는 AI 에이전트 기술의 실용성을 입증하는 중요한 사례다. 그동안 수많은 AI 에이전트들이 과대광고에 비해 기본적인 작업조차 완료하지 못하는 문제를 보여왔다. 앤트로픽은 가상 머신 기반 샌드박스 환경에서 특정 폴더만 접근 가능하도록 설계해 보안과 사용성의 균형을 맞췄다.사용자 영향일반 사용자들이 터미널 없이도 AI 에이전트의 자동화 기능을 활용할 수 있게 되었다. 파일 정리, 이메일 관리 같은 반복적인 작업을 AI에 위임하는 '컴퓨터 사용 경험의 진화'가 시작되는 셈이다. 다만 프롬프트 인젝션 공격 위험으로 인해 민감한 금융 정보나 개인 기록에는 사용을 자제해야 한다.경쟁 구도 변화OpenAI, 구글 등 경쟁사들도 유사한 에이전트 기능을 개발 중인 가운데, 앤트로픽이 사용자 친화적 인터페이스로 선점 효과를 노리고 있다. 특히 이미 Claude Code로 개발자 시장에서 입지를 다진 만큼, Cowork를 통한 일반 소비자 시장 확대 전략으로 볼 수 있다.Key Data & Facts항목수치/내용출시 형태연구 프리뷰 (베타)구독 요금월 $100 (Max 플랜)지원 플랫폼macOS 전용주요 기능파일 정리, 형식 변환, 이메일 관리, 웹 검색보안 방식가상 머신 샌드박스, 폴더별 권한 설정개발 기간약 2개월 (AI 도구 활용)Key Quote"We tried a bunch of different ideas to see what form factor would make sense for a less technical audience that doesn't want to use a terminal."— Boris Cherny, 앤트로픽 Claude Code 총괄
107 조회
0 추천
01.19 등록
Executive Summary• OpenAI가 수주 내 미국에서 ChatGPT 광고 테스트를 시작하며, 무료 및 Go 구독 사용자에게 쇼핑 관련 광고를 노출할 예정• 광고는 AI 응답과 별도로 하단에 명확히 표시되며, 사용자 데이터를 광고주에게 판매하지 않고 대화 내용도 광고주와 공유하지 않을 것이라고 밝힘• Plus, Pro, Enterprise 구독자는 광고가 표시되지 않으며, 18세 미만 및 건강·정치 등 민감한 주제에서는 광고가 제외됨BackgroundOpenAI의 ChatGPT는 주간 활성 사용자 8억 명 이상을 보유한 세계 최대 AI 소비자 제품 중 하나로 성장했다. 그러나 대부분의 사용자가 무료로 서비스를 이용하고 있어, 지금까지 약 640억 달러를 투자받은 OpenAI로서는 수익화 압박이 커지고 있었다. Google Gemini 등 경쟁사의 도전이 거세지면서 대규모 사용자층을 수익으로 전환해야 할 필요성이 더욱 절실해진 상황이다.Impact & Implications산업/시장 영향이번 광고 도입은 AI 챗봇 시장의 수익 모델에 중대한 전환점이 될 전망이다. ChatGPT의 광고 모델이 성공할 경우, 다른 AI 기업들도 유사한 전략을 채택할 가능성이 높다. OpenAI는 광고주에게 개별 사용자 정보(나이, 위치, 관심사 등)를 공개하지 않고, 대신 광고 노출 횟수나 클릭 수 같은 집계 데이터만 제공할 계획이다. 이는 기존 디지털 광고 생태계와 차별화된 접근법으로, 프라이버시를 중시하는 새로운 광고 모델의 시험대가 될 것이다.사용자 경험 영향OpenAI 애플리케이션 CEO 피지 시모는 "ChatGPT의 응답은 광고가 아닌 객관적으로 유용한 정보에 의해 결정된다는 신뢰가 필수"라고 강조했다. 광고는 챗봇 응답 아래 별도 영역에 표시되며, 사용자는 광고 개인화를 끄거나 광고용 데이터를 삭제할 수 있다. 그러나 시모는 향후 "정적인 메시지와 링크를 넘어선" 대화형 광고 경험을 암시하며, 사용자가 광고 상품에 대해 직접 질문할 수 있는 기능을 예고했다.향후 전망OpenAI는 "시간 소모 최적화"를 하지 않으며 "수익보다 사용자 신뢰와 경험을 우선시한다"고 밝혔다. 그러나 업계에서는 소셜 미디어가 겪었던 '사용자 경험 악화(enshittification)' 현상이 AI 챗봇에도 재현될 수 있다는 우려가 제기된다. Sam Altman CEO 역시 과거 소셜 미디어 시대의 실패, 특히 중독성 알고리즘의 부작용을 인정한 바 있어, 향후 광고 확대 과정에서 이러한 실수를 반복하지 않는 것이 OpenAI의 과제가 될 것이다.Key Data & Facts항목수치/내용ChatGPT 주간 활성 사용자8억 명 이상OpenAI 총 투자 유치액약 640억 달러ChatGPT Go 구독료월 8달러광고 적용 대상미국 내 무료 및 Go 사용자광고 제외 구독Plus, Pro, EnterpriseKey Quote"People trust ChatGPT for many important and personal tasks, so as we introduce ads, it's crucial we preserve what makes ChatGPT valuable in the first place. That means you need to trust that ChatGPT's responses are driven by what's objectively useful, never by advertising."— Fidji Simo, OpenAI CEO of Applications
142 조회
0 추천
01.18 등록
Executive Summary• 메타가 왓츠앱, 메신저, 인스타그램에 자체 AI 어시스턴트를 전면 도입• Llama 2 기반 커스텀 LLM으로 개발, 마이크로소프트 Bing과 연동해 실시간 웹 검색 지원• MrBeast, 스눕독 등 유명인 기반 28개 AI 캐릭터 동시 출시• ChatGPT 등 경쟁 서비스와 달리 무료 이미지 생성 기능 탑재• 수십억 일간 활성 사용자를 보유한 메타의 '유통망' 강점을 활용한 AI 전략BackgroundOpenAI의 ChatGPT가 촉발한 AI 챗봇 경쟁이 치열해지는 가운데, 메타가 자사 메시징 플랫폼의 압도적 규모를 무기로 AI 시장에 본격 진입했다. Llama 2 오픈소스 모델의 성공적 확산을 기반으로, 메타는 범용 AI 어시스턴트와 독특한 AI 캐릭터 라인업을 동시에 선보이며 차별화를 시도하고 있다.Impact & Implications산업/시장 영향메타의 AI 어시스턴트 출시는 ChatGPT, Claude 등 기존 AI 챗봇 시장에 상당한 파장을 일으킬 전망이다. 왓츠앱, 메신저, 인스타그램을 합산하면 수십억 명의 일간 사용자를 보유한 메타는 별도 앱 설치나 회원가입 없이 기존 채팅 환경에서 바로 AI를 활용할 수 있다는 점에서 접근성 측면의 압도적 우위를 점한다.기술적 의미메타는 Llama 2의 핵심 원리를 기반으로 대화에 최적화된 커스텀 모델을 구축했다. 특히 컨텍스트 윈도우를 확장해 더 깊은 대화가 가능하도록 했으며, 간결한 답변을 제공하도록 튜닝했다. Bing과의 파트너십을 통해 실시간 웹 정보를 제공하는 점도 무료 AI 서비스로서는 이례적이다.사용자 영향일반 사용자들은 이제 별도의 AI 앱 없이 일상적으로 사용하는 메신저 내에서 여행 계획, 정보 검색, 이미지 생성 등을 수행할 수 있게 됐다. 유명인 기반 AI 캐릭터는 새로운 형태의 엔터테인먼트 경험을 제공하며, 애니메이션 프로필 이미지 등 몰입감을 높이는 요소도 포함됐다.Key Data & Facts항목수치/내용출시 플랫폼WhatsApp, Messenger, InstagramAI 캐릭터 수28개 (유명인 기반 포함)기반 모델Llama 2 원리 기반 커스텀 LLM웹 검색 파트너Microsoft Bing안전성 테스트6,000시간 레드팀 테스트가격무료Key Quote"기존 AI들은 로봇 같거나 밋밋할 수 있다. 우리는 대화형이고 친근한 어조를 만들기 위해 추가 데이터셋을 정제하는 데 시간을 투자했다."— 아마드 알-다흘레, 메타 생성AI 부사장
200 조회
0 추천
01.17 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입