Loading...

AI 뉴스

화웨이, 칩 효율성을 두 배로 높이는 AI 소프트웨어 공개 예정

페이지 정보

작성자 xtalfi
작성일 2025.11.18 16:59
963 조회
0 추천
0 비추천

본문

a489cc5a8f80ff2a750ee6803fd9be08_1763452593_3651.png
(퍼플렉시티가 정리한 기사)


중국 기술 대기업 화웨이가 금요일 그래픽 처리 장치의 활용 효율성을 두 배로 높일 수 있는 첨단 인공지능 인프라 소프트웨어를 발표할 예정이라고 국영 언론이 보도했으며, 이는 하드웨어 한계를 소프트웨어 혁신으로 보완하려는 중국의 전략에서 또 다른 진전을 나타낸다.

11월 21일 AI 산업 컨퍼런스에서 공개될 예정인 이 기술은 AI 칩 활용률을 현재 업계 평균인 30~40%에서 70%로 높일 것이라고 상하이 증권 뉴스가 전했다. 이 소프트웨어는 화웨이의 Ascend 칩, 엔비디아 GPU 및 타사 프로세서 전반에 걸쳐 컴퓨팅 리소스의 통합 관리를 가능하게 한다.


서양 오케스트레이션 기법의 반영

이번 발표 계획은 Huawei가 Nvidia가 2024년 7억 달러에 인수한 텔아비브 기반 소프트웨어 회사 Run:ai와 유사한 기능을 개발하고 있는 가운데 나온 것입니다. Run:ai의 Kubernetes 기반 플랫폼은 GPU 클러스터 전반에 걸쳐 대규모 AI 워크로드를 조율하여 기업들이 동적 리소스 할당을 통해 하드웨어 활용도를 극대화할 수 있도록 합니다.

Nvidia는 2024년 12월 Run:ai 인수를 완료하고, 고객들이 AI 워크로드를 더욱 효율적으로 관리할 수 있도록 이 기술을 자사의 DGX Cloud 플랫폼에 통합했습니다. 이 소프트웨어는 분할 GPU 할당, 동적 스케줄링, 그리고 훈련, 튜닝, 추론 워크로드를 다르게 처리하는 워크로드 인식 오케스트레이션을 포함한 기능들을 제공합니다.


중국의 양적 우선 접근 방식

화웨이의 소프트웨어 중심 전략은 미국의 첨단 반도체 제조 장비 수출 규제로 인한 하드웨어 불리함을 상쇄하려는 중국의 광범위한 노력을 반영합니다. 엔비디아의 블랙웰 아키텍처에 필적하는 최첨단 칩에 접근할 수 없는 중국 기업들은 대량의 저성능 프로세서를 클러스터링하면서 서구 대안보다 훨씬 적은 컴퓨팅 파워를 필요로 하는 딥시크와 같은 효율적인 AI 모델을 실행하고 있습니다.

이러한 접근 방식은 견인력을 얻고 있는 것으로 보입니다. 월간 활성 사용자 1억 5,700만 명 이상을 보유한 중국 최대 인기 AI 애플리케이션인 바이트댄스의 더우바오 챗봇은 일일 토큰 사용량이 2025년 3월 12.7조에서 9월 30조 이상으로 급증하여 글로벌 AI 컴퓨팅 소비 선두 그룹에 진입했습니다.

이러한 성장으로 바이트댄스의 클라우드 인프라는 4월 기준 일일 50조 토큰을 처리한 마이크로소프트와 일일 약 43.3조 토큰을 처리한 알파벳의 구글에 근접한 수준에 도달했습니다.


전략적 의미

확인될 경우, 화웨이의 새로운 기술은 국내에서 Ascend AI 칩의 판매를 가속화하는 동시에 Nvidia 프로세서에 대한 중국의 의존도를 더욱 줄일 수 있습니다. 이 소프트웨어 기반 접근 방식은 중국이 반도체 제조 능력에서 “상대적으로 오랫동안” 뒤처질 가능성이 높다는 것을 인정하고, AI 인프라에서 경쟁하기 위한 대안적 전략이 필요하다는 화웨이 경영진의 발언과 일치합니다.

댓글 0
전체 1,366 / 45 페이지
• Nvidia는 NeurIPS 컨퍼런스에서 Alpamayo-R1을 공개했으며, 이는 사고 연쇄(chain-of-thought) AI 추론과 경로 계획을 통합하여 자율주행 자동차가 실시간으로 자신의 결정을 설명할 수 있도록 하는 세계 최초의 개방형 산업 규모 추론 비전 언어 행동 모델로 설명되었습니다.[quantumzeitgeist +1]• 이 모델은 센서 데이터를 자연어 설명으로 변환하고 주행 결정을 단계별로 추론함으로써 자율주행 차량 소프트웨어의 “블랙박스” 문제를 해결하며, 강화 학습 후처리 후 추론 품질이 45% 향상되었습니다.[quantumzeitgeist +1]• Nvidia는 비상업적 연구 용도로 GitHub와 Hugging Face에 이 모델을 공개했으며, 개발자들이 자율주행 차량 및 로봇공학을 위한 물리적 AI 모델을 맞춤화할 수 있도록 Cosmos Cookbook과 AlpaSim 평가 프레임워크도 함께 제공했습니다.[quantumzeitgeist +1]
573 조회
0 추천
2025.12.02 등록
Runway는 월요일에 Gen 4.5를 공개했으며, 이는 독립 벤치마킹 업체 Artificial Analysis가 관리하는 Video Arena 리더보드에서 1위를 차지한 새로운 AI 비디오 생성 모델로, 2위인 Google의 Veo 3 모델과 7위인 OpenAI의 Sora 2 Pro를 능가했다.PitchBook에 따르면 35억 5천만 달러의 가치를 평가받은 이 100명 규모의 스타트업은 블라인드 테스트를 사용하며, 투표자들이 어느 회사가 제작했는지 모르는 상태에서 비디오 결과물을 비교하여 순수한 사용자 선호도를 기반으로 편향되지 않은 순위를 보장한다.CEO Cristóbal Valenzuela는 CNBC에 Runway가 “100명의 팀으로 수조 달러 규모의 기업들을 능가하는 데 성공했다”고 말했으며, “David”라는 코드명의 이 모델은 주말까지 회사의 플랫폼, API 및 파트너 통합을 통해 모든 고객에게 제공될 예정이다.
546 조회
0 추천
2025.12.02 등록
Google은 12월 8일 오전 10시(태평양 표준시)에 30분간 라이브스트림을 개최하여 확장 현실 플랫폼인 Android XR의 업데이트를 공개할 예정이며, Gemini AI 통합이 적용된 헤드셋 및 스마트 안경의 새로운 기능에 중점을 둘 것입니다.이 행사는 10월에 출시된 Samsung의 Galaxy XR 헤드셋 출시에 이어 진행되는 것으로, 이는 1,799달러 가격의 첫 번째 Android XR 기기로서 4K 디스플레이와 손동작, 시선 추적, 음성 명령을 통한 AI 기반 상호작용을 특징으로 합니다.티저 자료에 따르면 Google은 2026년 출시 예정인 Samsung의 차기 스마트 안경을 선보일 가능성이 있으며, 이는 Apple의 부진한 Vision Pro 및 Meta의 보다 성공적인 Ray-Ban 스마트 안경과 경쟁하기 위한 것입니다.
544 조회
0 추천
2025.12.02 등록
• 한국 정부는 엔비디아로부터 약 1만3천 개의 GPU를 공급받아 국내 반입을 완료했으며, 이는 지난 5월 추경예산에서 확보한 1조4600억 원으로 집행됐다고 과학기술정보통신부가 1일 밝혔다.• 도입된 GPU에는 최신 B200 모델과 이전 세대 제품이 포함되어 있으며, 정부는 내년 초부터 대학·연구소·스타트업 등에 우선 배정하고 공공 분야에도 투입할 계획이다.• 이는 젠슨 황 CEO가 지난 10월 방한 시 약속한 총 26만여 장 규모(정부 5만 개, 삼성·SK·현대차 각 최대 5만 개, 네이버클라우드 6만 개)의 GPU 공급 계획 중 첫 물량이다.
568 조회
0 추천
2025.12.02 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입