AI 뉴스

Microsoft Azure가 GB300 GPU로 초당 110만 토큰 달성

페이지 정보

작성자 xtalfi
작성일 11.05 17:41
5 조회
0 추천
0 비추천

본문

LA_DC_60-1.jpg

(퍼플렉시티가 정리한 기사)


Microsoft는 Azure 클라우드 플랫폼에서 단일 랙 시스템으로 초당 110만 토큰이라는 전례 없는 성능을 달성하며 AI 처리 장벽을 무너뜨렸습니다. 이는 백만 토큰 임계값을 처음으로 돌파한 것으로, AI 추론 성능에 대한 새로운 업계 벤치마크를 확립했습니다.​

NVIDIA의 최첨단 GB300 GPU로 구동되는 Azure ND GB300 v6 가상 머신을 사용하여 달성한 이 이정표는 GB200 시스템으로 달성한 Microsoft의 이전 기록인 초당 865,000 토큰 대비 27% 향상된 수치입니다. 이 성능 테스트는 업계 표준인 Llama 2 70B 모델을 사용한 80분간의 벤치마크 실행 동안 Signal65에 의해 독립적으로 검증되었습니다.​


엔터프라이즈 AI를 위한 획기적인 성능

이 성과는 AI 배포의 경제성을 근본적으로 변화시켜, 기업들이 엄격한 규정 준수 요구사항을 유지하면서 수천 명의 동시 사용자를 지원할 수 있게 합니다. 각 NVIDIA GB300 GPU는 초당 15,200개의 토큰을 처리하여 이전 세대 H100 칩보다 5배의 처리량을 제공하며, Signal65가 "엘리트 AI 성능"이라고 부른 것이 이제 접근 가능한 유틸리티로 제공됨을 보여줍니다.​

Microsoft의 이 혁신은 회사가 대규모 AI 인프라 투자를 가속화하는 시기에 나왔습니다. 이 기술 대기업은 월요일에 세 건의 별도 수십억 달러 규모 AI 거래를 발표했으며, 여기에는 추가 NVIDIA GB300 용량을 위한 IREN Limited와의 97억 달러 규모 파트너십과 수만 개의 GPU 배포를 위한 Lambda와의 별도 계약이 포함됩니다.​


AI 군비 경쟁에서의 인프라 리더십

이 기록적인 성능은 이전 세대 대비 50% 더 많은 메모리와 16% 높은 열용량을 포함한 향상된 사양을 갖춘 72개의 GPU를 탑재한 단일 NVIDIA GB300 NVL72 랙에 걸쳐 18개의 가상 머신을 사용하여 달성되었습니다. 이 시스템은 가상 머신당 초당 평균 61,163개의 토큰 처리량으로 놀라운 일관성을 보여주었습니다.​

"이 성능 이정표는 NVIDIA와의 지속적인 협력을 보여주며 프로덕션 환경에서 광범위한 AI 워크로드를 관리하는 Azure의 능력을 강조합니다"라고 Microsoft CEO 사티아 나델라는 말하며, 이 성과가 Azure를 엔터프라이즈 AI 추론을 위한 최고의 플랫폼으로 자리매김하게 한다고 강조했습니다. 이 이정표는 단순한 기술적 성과 이상을 의미합니다. 산업 규모의 AI 처리가 클라우드에 도입되었음을 알리며, 대규모 내부 인프라 투자 없이도 주류 기업들이 정교한 AI 기능에 접근할 수 있게 되었습니다.

댓글 0
전체 773 / 1 페이지
(퍼플렉시티가정리한기사)구글은수요일,세계에서가장인기있는내비게이션앱을운전자가핸들을잡은채복잡한질문을처리할수있는대화형부조종사로변모시키기위해GeminiAI어시스턴트를구글맵스에직접내장한다고발표했습니다.앞으로몇주안에Android및iOS기기에출시될이번업그레이드는구글이AI를내비게이션의중심에배치하면서수년만에가장중요한맵스업데이트를나타냅니다.​혁신적인핸즈프리경험Gemini통합을통해사용자는운전중Maps와자연스러운대화를나눌수있으며,"내경로를따라비건옵션이있는저렴한식당이있나요,몇마일이내로요?"와같은복잡한질문을한다음"거기주차는어때요?"와같은후속질문을할수있습니다.AI어시스턴트는캘린더일정추가,뉴스브리핑제공,"사고가보여요"또는"앞에침수가있어요"라고말하는것만으로교통사고신고등비내비게이션작업도처리할수있습니다.​Google은앱개편에대한블로그게시물에서"더이상헤맬필요없이이제그냥물어보기만하면됩니다"라고약속했습니다.이기능은20년에걸쳐축적된GoogleMaps의2억5천만개장소데이터베이스와Gemini의대화기능을결합하여후속질문을이해하는맥락적응답을제공합니다.​랜드마크기반내비게이션서비스시작대화형기능과함께Google은거리기반안내를운전자가실제로볼수있는시각적단서로대체하는랜드마크기반내비게이션을도입하고있습니다."500피트후우회전"이라는안내대신,사용자는"ThaiSiamRestaurant지나서우회전"과같은안내를받게되며,접근할때지도에서랜드마크가강조표시됩니다.​이시스템은Gemini의비전기능을사용하여StreetView이미지를분석하고Google의위치데이터베이스와교차참조하여경로를따라가장잘보이고유용한기준점을식별합니다.이랜드마크기반내비게이션은이미미국의Android및iOS사용자에게출시되고있습니다.​선제적인텔리전스및향후전개GoogleMaps는이제내비게이션이실행되지않은상태에서도교통혼잡,사고및도로폐쇄에대해사용자에게사전에알림을제공하며,일반적인경로를학습하고사용자가일반적으로이동하는시간을예측합니다.이러한사전교통알림은현재미국의Android사용자를대상으로제공되며,iOS지원은곧제공될예정입니다.​대화형내비게이션기능은향후몇주내에"Gemini를사용할수있는모든곳"에서제공될예정이며,AndroidAuto지원은나중에제공됩니다.그러나소프트웨어제한으로인해AppleCarPlay와의통합은불확실합니다.Google은또한이번달말에Gemini와GoogleLens통합을출시하여사용자가카메라로시설을가리키고질문할수있도록할예정입니다.​이번업데이트는GoogleMaps를"모든것을아는부조종사"로자리매김하며,Google은경쟁사와내비게이션서비스를차별화하고전세계20억명의앱사용자를대상으로ChatGPT보다Gemini에경쟁우위를제공하려고합니다.
2 조회
0 추천
00:30 등록
(퍼플렉시티가정리한기사)Microsoft는화요일자사의주권클라우드서비스에대한대대적인개선사항을발표했으며,유럽연합데이터경계내에서엔드투엔드AI데이터처리를도입하고Microsoft365Copilot서비스에대한국가내처리기능을2026년까지15개국으로확대한다고밝혔습니다.​이번발표는클라우드기반AI혁신에접근하면서도민감한데이터에대한통제권을유지하고자하는유럽정부및기업들의증가하는규제요구사항을해결합니다.이번확장에는Microsoft의AzureLocal플랫폼에대한상당한인프라개선이포함되어있으며,이제NVIDIAGPU통합을통해수백대의서버를지원할수있게되어이전의16대서버제한에서크게증가했습니다.​유럽데이터주권이중심무대에오르다강화된EU데이터경계프레임워크에따라AI상호작용을통해생성된모든고객데이터는EU국경내에서만저장및처리됩니다.Microsoft는확장발표에서"귀하의데이터,귀하의통제—어디서운영하든"이라고밝혔습니다.​이거대기술기업은또한유럽전역의데이터센터운영을감독하기위해유럽국적자로만구성된유럽이사회를설립했으며,이는유럽법률에따라운영됩니다.이러한거버넌스구조는CLOUDAct와같은법률에따른미국정부의유럽데이터접근에대한우려를해소하기위한것입니다.​호주,인도,일본및영국의Microsoft365Copilot사용자는2025년말까지국내데이터처리에대한액세스를얻게되며,독일,이탈리아,스페인,스웨덴및스위스를포함한11개추가국가가2026년에뒤따를예정입니다.Office365Enterprise및CloudEngineering담당기업부사장인PaulLorimer는이번출시가"정부기관및고도로규제된산업의중요한데이터주권문제를해결한다"고확인했습니다.​강화된프라이빗클라우드인프라Microsoft의SovereignPrivateCloud는AzureLocal시스템에서최신NVIDIARTXPro6000BlackwellGPU지원을포함한주요업그레이드를받았습니다.이러한향상된시스템은1,000개이상의AI모델을실행할수있으며StorageAreaNetwork통합을지원하여조직이데이터관할권요구사항을유지하면서기존온프레미스스토리지를활용할수있도록합니다.​Microsoft365Local은2025년12월에정식출시되어ExchangeServer,SharePointServer및SkypeforBusinessServer를AzureLocal환경에기본적으로제공합니다.완전한에어갭배포를위한완전연결해제운영모드는2026년초에제공될예정입니다.​또한Microsoft는AICloudPartnerProgram내에DigitalSovereignty전문분야를출시하여인증된파트너가규정을준수하는주권클라우드솔루션제공에대한전문성을입증할수있도록했습니다.
2 조회
0 추천
00:28 등록
(퍼플렉시티가정리한기사)정부가AI인프라확대를추진하며에너지소비량을줄이겠다는상반된목표를동시에제시해정책일관성에대한의문이제기되고있다.특히SK그룹과아마존웹서비스(AWS)가7조원을투자하는울산AI데이터센터가분산에너지특구선정에서배제되면서논란이가중되고있다.에너지소비감축목표와AI투자확대동시추진기후에너지환경부는5일에너지위원회를열고'제7차에너지이용합리화기본계획'을의결했다고발표했다.이계획에따르면정부는2024년2억1200만toe(석유환산톤)인최종에너지소비량을2029년까지2억1100만toe로4.7%감소시켜"에너지소비량감소국가"로전환하겠다는목표를제시했다.​그러나AI데이터센터와반도체공장증설로인한전력수요급증은이러한목표달성을어렵게만들전망이다.한국데이터센터에너지효율협회에따르면국내데이터센터의전력용량은2024년1.08GW에서2029년2.37GW로2배이상증가할것으로예측된다.이는최근엔비디아의GPU26만장추가공급등은고려하지도않은수치다.​울산AI특화단지,분산에너지특구서제외정책모순은분산에너지특구선정에서도드러났다.기후부는같은날제주·전남과부산강서·경기의왕등4곳을분산에너지특구로최종선정했다고발표했다.분산에너지특구로지정되면전력직거래를통해전력구매가를낮출수있는혜택을받게된다.​하지만산업수요가많은후보지였던울산·포항·서산등은탈락했다.특히울산은SK그룹과AWS가7조원을투자해2027년부터운영예정인국내최대규모의AI전용데이터센터가위치한곳이다.이데이터센터는100MW급그래픽처리장치전용설비를갖춘AI인프라로약6만장의GPU가투입될예정이다.​전문가들"정책현실성부족"지적전문가들은AI투자확대와에너지절감정책이양립하기어렵다고지적하고있다.구혁채과학기술정보통신부제1차관은최근간담회에서"AI의가장큰문제는에너지문제"라며"양자기술이에너지문제를해결할수있는유일한방법"이라고언급하기도했다.​정부는이번계획에서데이터센터에대해서도전력효율수준신규지표마련·적용과주요설비효율등급제적용,수요관리제도신설등을통한에너지효율개선방안을제시했다.하지만AI시대막대한전력수요증가를감안할때정책목표달성에는한계가있을것으로보인다.
2 조회
0 추천
00:26 등록
(퍼플렉시티가정리한기사)Nebius는화요일에TokenFactory플랫폼을공개하며,급성장하는인공지능추론시장에서Microsoft및기타거대기술기업들과직접경쟁할수있는위치에AI클라우드제공업체를자리매김했습니다.​암스테르담에본사를둔이회사의새로운프로덕션추론플랫폼은기업들이오픈소스AI모델을엔터프라이즈규모로배포하고최적화할수있도록지원하며,NVIDIANemotron,DeepSeek,OpenAI의GPT-OSS,Meta의Llama,그리고Qwen을포함한주요모델들을지원합니다.Nebius의AICloud3.0"Aether"인프라를기반으로구축된TokenFactory는분당수억건의요청을초과하는워크로드에대해1초미만의지연시간,자동확장처리량,그리고99.9%의가동시간을제공합니다.​얼리어답터들이상당한비용절감효과를보고하다초기고객들은이미플랫폼을통해상당한경제적이익을얻고있습니다.주요라이프스타일및전자상거래브랜드를운영하는Prosus는독점모델과비교하여최대26배의비용절감을달성했습니다.이회사는현재TokenFactory의전용엔드포인트와자동확장기능을사용하여매일최대2,000억개의토큰을처리하고있습니다.​Prosus의AI이사인ZülküfGenç는"NebiusTokenFactory의유연성,제품및신속한응답덕분에프로덕션전과정에서이러한속도를유지할수있었습니다"라고말했습니다."자동확장기능의추가는게임체인저였으며,수동개입없이대규모워크로드를처리할수있게해주었습니다."​선도적인비디오플랫폼인HiggsfieldAI는온디맨드및자동확장추론기능에대해Nebius를"우리의요구사항을충족하는유일한제공업체"라고언급했습니다.한편,HuggingFace는대규모오픈소스모델을기반으로구축하는개발자들의접근성을개선하기위해Nebius와협력하고있습니다.​기술거대기업에대한경쟁적포지셔닝이출시는Nebius가AI추론분야에서MicrosoftAzure와AmazonWebServices와같은기존클라우드제공업체로부터시장점유율을확보하려는가운데이루어졌습니다.TokenFactory는오픈소스모델에중점을둠으로써,OpenAI기술과의긴밀한통합에집중하는Microsoft와는대조적인전략을취하고있으며,독점AI솔루션에대한대안을모색하는기업들에게매력적으로다가갈수있습니다.​“Nebius의공동창업자이자최고비즈니스책임자인RomanChernin은‘각팀마다고유한요구사항이있으며,무거운작업없이도속도,신뢰성,비용효율성을원한다’고말했습니다.이플랫폼은유럽연합또는미국데이터센터에서의제로보존추론,SOC2TypeII보안인증,종합적인거버넌스도구등엔터프라이즈급기능을포함하고있습니다.​제품출시에도불구하고Nebius의주가는최근변동성을보였으며,11월1일7.9%하락해120.47달러로마감했지만,지난1년동안481%라는눈에띄는상승세를유지하고있습니다.회사는11월11일3분기실적을발표할예정이며,투자자들은174억달러규모의Microsoft용량계약진행상황을예의주시하고있습니다.
2 조회
0 추천
00:25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입