AI 뉴스

Microsoft Azure가 GB300 GPU로 초당 110만 토큰 달성

페이지 정보

작성자 xtalfi
작성일 11.05 17:41
10 조회
0 추천
0 비추천

본문

LA_DC_60-1.jpg

(퍼플렉시티가 정리한 기사)


Microsoft는 Azure 클라우드 플랫폼에서 단일 랙 시스템으로 초당 110만 토큰이라는 전례 없는 성능을 달성하며 AI 처리 장벽을 무너뜨렸습니다. 이는 백만 토큰 임계값을 처음으로 돌파한 것으로, AI 추론 성능에 대한 새로운 업계 벤치마크를 확립했습니다.​

NVIDIA의 최첨단 GB300 GPU로 구동되는 Azure ND GB300 v6 가상 머신을 사용하여 달성한 이 이정표는 GB200 시스템으로 달성한 Microsoft의 이전 기록인 초당 865,000 토큰 대비 27% 향상된 수치입니다. 이 성능 테스트는 업계 표준인 Llama 2 70B 모델을 사용한 80분간의 벤치마크 실행 동안 Signal65에 의해 독립적으로 검증되었습니다.​


엔터프라이즈 AI를 위한 획기적인 성능

이 성과는 AI 배포의 경제성을 근본적으로 변화시켜, 기업들이 엄격한 규정 준수 요구사항을 유지하면서 수천 명의 동시 사용자를 지원할 수 있게 합니다. 각 NVIDIA GB300 GPU는 초당 15,200개의 토큰을 처리하여 이전 세대 H100 칩보다 5배의 처리량을 제공하며, Signal65가 "엘리트 AI 성능"이라고 부른 것이 이제 접근 가능한 유틸리티로 제공됨을 보여줍니다.​

Microsoft의 이 혁신은 회사가 대규모 AI 인프라 투자를 가속화하는 시기에 나왔습니다. 이 기술 대기업은 월요일에 세 건의 별도 수십억 달러 규모 AI 거래를 발표했으며, 여기에는 추가 NVIDIA GB300 용량을 위한 IREN Limited와의 97억 달러 규모 파트너십과 수만 개의 GPU 배포를 위한 Lambda와의 별도 계약이 포함됩니다.​


AI 군비 경쟁에서의 인프라 리더십

이 기록적인 성능은 이전 세대 대비 50% 더 많은 메모리와 16% 높은 열용량을 포함한 향상된 사양을 갖춘 72개의 GPU를 탑재한 단일 NVIDIA GB300 NVL72 랙에 걸쳐 18개의 가상 머신을 사용하여 달성되었습니다. 이 시스템은 가상 머신당 초당 평균 61,163개의 토큰 처리량으로 놀라운 일관성을 보여주었습니다.​

"이 성능 이정표는 NVIDIA와의 지속적인 협력을 보여주며 프로덕션 환경에서 광범위한 AI 워크로드를 관리하는 Azure의 능력을 강조합니다"라고 Microsoft CEO 사티아 나델라는 말하며, 이 성과가 Azure를 엔터프라이즈 AI 추론을 위한 최고의 플랫폼으로 자리매김하게 한다고 강조했습니다. 이 이정표는 단순한 기술적 성과 이상을 의미합니다. 산업 규모의 AI 처리가 클라우드에 도입되었음을 알리며, 대규모 내부 인프라 투자 없이도 주류 기업들이 정교한 AI 기능에 접근할 수 있게 되었습니다.

댓글 0
전체 781 / 10 페이지
(퍼플렉시티가정리한기사)아마존은오늘고급AI어시스턴트AlexaPlus를iOS및Android기기의AmazonMusic앱에출시했으며,이는대화형인공지능을주류소비자경험에통합하려는회사의가장대담한시도입니다.​현재AlexaPlusEarlyAccess프로그램사용자를위한모든AmazonMusic구독등급에서사용가능한이기능은음악발견을기본음성명령에서자연스러운대화로전환합니다.사용자는앱의오른쪽하단에있는"a"버튼을탭하고기존검색기능으로는어려운요청을하여AI어시스턴트에액세스할수있습니다.​대화를통한향상된음악발견AlexaPlus는사용자가단편적인가사를사용하여노래를식별하거나,특정연도의차트순위에대해질문하거나,"보이밴드를제외한마돈나같은아티스트의90년대팝"과같은매우구체적인플레이리스트를요청할수있게합니다.이어시스턴트는또한노래의의미를설명하고,샘플의출처를추적하며,아티스트의영향력과디스코그래피에대한상세한지식을제공할수있습니다.​아마존은AlexaPlus를사용하는고객이기존어시스턴트보다3배더많이음악을탐색하며,추천을원하는사용자는거의70%더많은음악을듣는다고보고합니다.이통합은음악스트리밍이AI기능경쟁으로변화함에따라경쟁사들과경쟁하기위한아마존의전략을나타냅니다.​산업AI추진에대한경쟁적대응이번출시는Spotify가10월에ChatGPT기능을통합하여사용자들이대화형프롬프트를통해개인맞춤형음악추천을받을수있게된지불과몇주만에이루어졌습니다.Apple이2026년봄출시예정으로향상된Siri기능을계속개발하고있는동안,Amazon은음악발견을"지식이풍부한친구와의대화"처럼느껴지도록만들어경쟁사들을뛰어넘는위치를점하고있습니다.​AlexaPlus는궁극적으로Prime회원에게무료로제공될예정이며,얼리액세스기간이종료된후Prime비가입자는월$19.99에이용할수있습니다.이통합은주요스트리밍서비스내에서생성형AI어시스턴트의첫번째주요배포중하나입니다.
11 조회
0 추천
11.05 등록
(퍼플렉시티가정리한기사)Microsoft는Azure클라우드플랫폼에서단일랙시스템으로초당110만토큰이라는전례없는성능을달성하며AI처리장벽을무너뜨렸습니다.이는백만토큰임계값을처음으로돌파한것으로,AI추론성능에대한새로운업계벤치마크를확립했습니다.​NVIDIA의최첨단GB300GPU로구동되는AzureNDGB300v6가상머신을사용하여달성한이이정표는GB200시스템으로달성한Microsoft의이전기록인초당865,000토큰대비27%향상된수치입니다.이성능테스트는업계표준인Llama270B모델을사용한80분간의벤치마크실행동안Signal65에의해독립적으로검증되었습니다.​엔터프라이즈AI를위한획기적인성능이성과는AI배포의경제성을근본적으로변화시켜,기업들이엄격한규정준수요구사항을유지하면서수천명의동시사용자를지원할수있게합니다.각NVIDIAGB300GPU는초당15,200개의토큰을처리하여이전세대H100칩보다5배의처리량을제공하며,Signal65가"엘리트AI성능"이라고부른것이이제접근가능한유틸리티로제공됨을보여줍니다.​Microsoft의이혁신은회사가대규모AI인프라투자를가속화하는시기에나왔습니다.이기술대기업은월요일에세건의별도수십억달러규모AI거래를발표했으며,여기에는추가NVIDIAGB300용량을위한IRENLimited와의97억달러규모파트너십과수만개의GPU배포를위한Lambda와의별도계약이포함됩니다.​AI군비경쟁에서의인프라리더십이기록적인성능은이전세대대비50%더많은메모리와16%높은열용량을포함한향상된사양을갖춘72개의GPU를탑재한단일NVIDIAGB300NVL72랙에걸쳐18개의가상머신을사용하여달성되었습니다.이시스템은가상머신당초당평균61,163개의토큰처리량으로놀라운일관성을보여주었습니다.​"이성능이정표는NVIDIA와의지속적인협력을보여주며프로덕션환경에서광범위한AI워크로드를관리하는Azure의능력을강조합니다"라고MicrosoftCEO사티아나델라는말하며,이성과가Azure를엔터프라이즈AI추론을위한최고의플랫폼으로자리매김하게한다고강조했습니다.이이정표는단순한기술적성과이상을의미합니다.산업규모의AI처리가클라우드에도입되었음을알리며,대규모내부인프라투자없이도주류기업들이정교한AI기능에접근할수있게되었습니다.
11 조회
0 추천
11.05 등록
(퍼플렉시티가정리한기사)Anyscale과Microsoft는오늘Azure에서새로운AI네이티브컴퓨팅서비스를출시하기위한파트너십을발표했으며,즉시비공개프리뷰에진입하고Ray의분산컴퓨팅기능을엔터프라이즈규모의클라우드서비스로대폭확장하는계기가되었습니다.​완전관리형퍼스트파티Azure서비스는Anyscale이만든오픈소스분산컴퓨팅프레임워크인Ray를기반으로하며,기업들이AI워크로드를확장할때레거시컴퓨팅시스템으로직면하는한계를해결합니다.이서비스는코드변경없이도자체관리형Ray에비해최대10배빠른성능을제공합니다.​엔터프라이즈급AI컴퓨팅솔루션"AI는모든산업을재정의하고있지만,이를확장하는것은여전히가장어려운과제중하나입니다"라고Anyscale의CEO인KeertiMelkote는말했습니다."Microsoft와함께,우리는기업들이대규모로AI를구축하고실행하는것을획기적으로더쉽게만들고있습니다—Ray를위해특별히제작된Anyscale의플랫폼과Azure의신뢰할수있는인프라를결합하여기업들이인프라관리가아닌혁신에집중할수있도록합니다".​새로운서비스는AzureKubernetesService(AKS)에서직접실행되며,AzurePortal을통한간소화된클러스터배포,대화형개발환경,그리고배치처리와저지연서빙모두를위한장애허용Ray클러스터를기업에제공합니다.Azure고객들은통합청구의혜택을받을수있으며,기존MicrosoftAzureConsumptionCommitments를이서비스에적용할수있습니다.​Ray의성장하는엔터프라이즈도입Ray는월간2,700만건이상의다운로드와39,000개의GitHub스타를기록하며AI인프라의핵심기술로부상했습니다.Uber,Spotify,Canva,Coinbase를포함한주요기업들이이미분산AI컴퓨팅을위해Ray를활용하고있습니다.이프레임워크는단일파이프라인에서CPU와GPU와같은특수가속기전반에걸쳐데이터처리,모델학습및추론을통합함으로써현대AI의복잡성을해결합니다.​Microsoft의클라우드네이티브컴퓨팅담당CorporateVicePresident이자Kubernetes공동창시자인BrendanBurns는"기업들은AI워크로드를확장할때유연성과제어권을원합니다"라고말했습니다."Azure의Anyscale을통해Ray를AzureKubernetesService에도입함으로써,우리는개발자들에게익숙한클라우드네이티브패턴을사용하여AI애플리케이션을구축하고확장할수있는능력을제공하고있습니다".​이서비스는AzurePortal을통해비공개프리뷰로유지되며,2026년에정식출시될예정입니다.
11 조회
0 추천
11.05 등록
(퍼플렉시티가정리한기사)Google는화요일에가장야심찬문샷프로젝트를발표했습니다:프로젝트선캐처(ProjectSuncatcher)는회사의인공지능칩을탑재한위성네트워크를사용하여우주에태양광발전데이터센터를구축하는연구이니셔티브입니다.이거대기술기업은지구대기권밖에서머신러닝확장가능성을테스트하기위해PlanetLabs와협력하여2027년초까지두개의프로토타입위성을발사할계획입니다.​이프로젝트는컴퓨팅수요가급증함에따라AI개발이직면한에너지제약문제를해결합니다."우리의TPU가우주로향합니다!"GoogleCEO순다르피차이(SundarPichai)는이이니셔티브를발표하며말했습니다."양자컴퓨팅에서자율주행에이르기까지우리의문샷역사에서영감을받아,프로젝트선캐처는언젠가우주에서확장가능한ML컴퓨팅시스템을구축하여태양의더많은에너지를활용할수있는방법을탐구하고있습니다".​AI인프라에대한혁신적인접근방식Google의시스템은태양광패널이지상설치보다최대8배많은전력을생성할수있고거의지속적인햇빛을받을수있는새벽-황혼태양동기저궤도에서위성군집에텐서처리장치(TPU)를배치할예정입니다.위성들은Starlink와같은기존군집보다훨씬가깝게수백미터간격으로배치되며,초당1.6테라비트를달성하는자유공간광학링크를통해연결될것입니다.​이프로젝트를이끄는Google의지능패러다임선임이사TravisBeals는"AI사용이계속증가하고이를구동하기위해더많은에너지를원하는방향으로계속진행된다면,이것은확장할수있는엄청난잠재력을가지고있습니다"라고말했습니다.회사의분석에따르면발사비용이2035년까지킬로그램당약200달러로떨어질수있으며,이는우주기반데이터센터를킬로와트당기준으로지상시설과경제적으로비교가능하게만들것입니다.​테스트및기술적과제Google은이미최신Trillium세대TPU에대해입자가속기를사용하여수년간의우주노출을시뮬레이션하는유망한방사선테스트를수행했습니다.이칩들은예상되는5년임무선량의최대15배까지손상없이견뎌냈으며,이는우주응용분야에서놀라운방사선내성을나타냅니다.Beals는"칩들이상당히잘버텼습니다"라고언급하며,프로세서가5~6년임무를쉽게처리할수있을것이라고시사했습니다.​그러나진공상태에서의열관리,고대역폭지상통신,그리고서로수킬로미터이내에서위성편대를유지하는것등상당한공학적과제가남아있습니다.이는현재의우주기술을훨씬뛰어넘는정밀도를요구합니다.Planet과의2027년프로토타입임무는이러한핵심시스템들을테스트하고위성네트워크전반에걸친분산머신러닝워크로드를검증할것입니다.
10 조회
0 추천
11.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입