Loading...

AI 뉴스

Microsoft Azure가 GB300 GPU로 초당 110만 토큰 달성

페이지 정보

작성자 xtalfi
작성일 11.05 17:41
181 조회
0 추천
0 비추천

본문

LA_DC_60-1.jpg

(퍼플렉시티가 정리한 기사)


Microsoft는 Azure 클라우드 플랫폼에서 단일 랙 시스템으로 초당 110만 토큰이라는 전례 없는 성능을 달성하며 AI 처리 장벽을 무너뜨렸습니다. 이는 백만 토큰 임계값을 처음으로 돌파한 것으로, AI 추론 성능에 대한 새로운 업계 벤치마크를 확립했습니다.​

NVIDIA의 최첨단 GB300 GPU로 구동되는 Azure ND GB300 v6 가상 머신을 사용하여 달성한 이 이정표는 GB200 시스템으로 달성한 Microsoft의 이전 기록인 초당 865,000 토큰 대비 27% 향상된 수치입니다. 이 성능 테스트는 업계 표준인 Llama 2 70B 모델을 사용한 80분간의 벤치마크 실행 동안 Signal65에 의해 독립적으로 검증되었습니다.​


엔터프라이즈 AI를 위한 획기적인 성능

이 성과는 AI 배포의 경제성을 근본적으로 변화시켜, 기업들이 엄격한 규정 준수 요구사항을 유지하면서 수천 명의 동시 사용자를 지원할 수 있게 합니다. 각 NVIDIA GB300 GPU는 초당 15,200개의 토큰을 처리하여 이전 세대 H100 칩보다 5배의 처리량을 제공하며, Signal65가 "엘리트 AI 성능"이라고 부른 것이 이제 접근 가능한 유틸리티로 제공됨을 보여줍니다.​

Microsoft의 이 혁신은 회사가 대규모 AI 인프라 투자를 가속화하는 시기에 나왔습니다. 이 기술 대기업은 월요일에 세 건의 별도 수십억 달러 규모 AI 거래를 발표했으며, 여기에는 추가 NVIDIA GB300 용량을 위한 IREN Limited와의 97억 달러 규모 파트너십과 수만 개의 GPU 배포를 위한 Lambda와의 별도 계약이 포함됩니다.​


AI 군비 경쟁에서의 인프라 리더십

이 기록적인 성능은 이전 세대 대비 50% 더 많은 메모리와 16% 높은 열용량을 포함한 향상된 사양을 갖춘 72개의 GPU를 탑재한 단일 NVIDIA GB300 NVL72 랙에 걸쳐 18개의 가상 머신을 사용하여 달성되었습니다. 이 시스템은 가상 머신당 초당 평균 61,163개의 토큰 처리량으로 놀라운 일관성을 보여주었습니다.​

"이 성능 이정표는 NVIDIA와의 지속적인 협력을 보여주며 프로덕션 환경에서 광범위한 AI 워크로드를 관리하는 Azure의 능력을 강조합니다"라고 Microsoft CEO 사티아 나델라는 말하며, 이 성과가 Azure를 엔터프라이즈 AI 추론을 위한 최고의 플랫폼으로 자리매김하게 한다고 강조했습니다. 이 이정표는 단순한 기술적 성과 이상을 의미합니다. 산업 규모의 AI 처리가 클라우드에 도입되었음을 알리며, 대규모 내부 인프라 투자 없이도 주류 기업들이 정교한 AI 기능에 접근할 수 있게 되었습니다.

댓글 0
전체 1,021 / 58 페이지
(퍼플렉시티가정리한기사)네이버가6일서울코엑스에서개최된'단25(DAN25)'콘퍼런스를통해통합AI에이전트'에이전트N'을공개하며소비자서비스부터제조업까지아우르는AI전환전략을발표했다.검색과쇼핑을넘어AI기업으로의전면도약을선언한이번발표는국내AI산업지형에큰변화를예고하고있다.​최수연네이버대표는기조연설에서"지난1년간독자적기술력으로검색,쇼핑,로컬,금융등주요서비스에AI를접목한결과,사용자만족도가증가하고매출성장을견인하는등긍정적인시그널을얻었다"며"그동안의경험과기술력을바탕으로주요서비스에순차적으로고도화된에이전트를본격도입한다"고밝혔다.​내년상반기AI에이전트본격출시네이버는내년1분기AI쇼핑서비스'네이버플러스스토어'에쇼핑에이전트를먼저출시하고,2분기에는통합검색에AI에이전트를적용한'AI탭'을선보일계획이라고발표했다.​'에이전트N'의핵심은사용자가검색어를고민할필요없이자연스러운대화만으로원하는콘텐츠,상품,서비스에연결되고실제구매나예약까지완료할수있다는점이다.김범준네이버최고운영책임자(COO)는"다양한유형의메타데이터를확보할수있는네이버만의장점을살려실제구매자와예약자만남길수있는리뷰,판매자와직접연결된재고데이터등신뢰도높은데이터인프라를구축했다"고설명했다.​이와함께네이버는비즈니스통합에이전트'에이전트N포비즈니스'도내년부터순차공개할예정이다.이종민광고사업부문장은"분산되어있던사업자솔루션과데이터를하나의비즈니스허브로통합해사업자가AI를기반으로비즈니스환경을분석하고현황을손쉽게진단,개선하는데도움을줄것"이라고말했다.​1조원GPU투자로제조업AI전환주도네이버는AI인프라구축을위해2026년까지GPU에만1조원이상을투자할계획을밝혔다.이는올해3분기영업이익5706억원을훨씬웃도는규모로,네이버의AI사업에대한강한의지를보여준다.​특히네이버클라우드는'소버린AI2.0'전략을통해반도체,자동차,조선등한국핵심제조산업의AI전환을이끌겠다고발표했다.김유원네이버클라우드대표는"네이버는자국의언어,데이터,산업구조를가장깊이이해하는기업으로서산업별버티컬AI모델을구축해가고있다"며"조선,에너지,바이오등주요산업기업들과협력해제조전과정의AI활용을고도화하고,이기술을사우디아라비아,태국,일본등글로벌시장으로확산하겠다"고말했다.​최수연대표는"반도체,자동차,조선등한국제조핵심산업의탄탄한경쟁력위에네이버가갖춘독보적인AI소프트웨어역량을더해대한민국산업전반의AI전환과혁신을가속화할것"이라며"풀스택AI기술역량을바탕으로대한민국이AI3대강국으로도약하는데기여하겠다"고강조했다.​이번발표는네이버가3분기사상최대실적(매출3조1381억원,영업이익5706억원)을기록한가운데나온것으로,탄탄한재무기반을바탕으로한공격적AI투자전략으로평가된다.
154 조회
0 추천
11.06 등록
(퍼플렉시티가정리한기사)Google는화요일에GeminiDeepResearch도구가이제Gmail,GoogleDrive및GoogleChat의개인데이터에접근하고분석할수있다고발표했으며,이는AI어시스턴트의업무기능이크게확장되었음을의미합니다.​Google이"가장많이요청된기능중하나"라고설명한이번통합은사용자가내부업무컨텍스트를웹데이터와결합하여포괄적인리서치보고서를작성할수있게합니다.사용자는이제이메일,문서,스프레드시트,프레젠테이션,PDF,채팅대화의정보를외부소스와함께종합하여시장분석및경쟁인텔리전스와같은작업을수행할수있습니다.​기업사용자를위한향상된연구기능이기능은전문가들이개인작업자원과공개데이터를병합하여더욱철저한분석을수행할수있도록합니다.구글의발표에따르면,팀들은이제"딥리서치가팀의초기브레인스토밍문서,관련이메일스레드,프로젝트계획을분석하여신제품에대한시장분석을시작할수있습니다".이와마찬가지로사용자들은공개웹데이터와내부전략,비교스프레드시트,팀논의를교차참조하여경쟁자보고서를작성할수있습니다.​이통합기능은Gemini의도구메뉴에서DeepResearch를선택하여액세스할수있으며,사용자는Gmail,Drive,Chat또는웹검색중에서원본옵션을선택할수있습니다.이기능은현재데스크톱플랫폼의모든Gemini사용자에게제공되고있으며,모바일접근은"향후며칠내에"제공될예정입니다.​경쟁적인AI환경이심화되고있다이발표는주요기술기업들이AI어시스턴트를직장데이터와통합하기위해경쟁하고있는가운데나왔습니다.마이크로소프트는최근Copilot에비슷한기능을도입하여WindowsInsider를위한커넥터를통해Gmail과Google서비스를사용할수있도록했습니다.OpenAI또한ChatGPT의작업공간통합기능을확장하여Slack,SharePoint및다양한생산성도구를위한커넥터를추가했습니다.​​이와같은시기는AI기반생산성시장에서구글이경쟁우위를유지하려는노력을보여줍니다.구글은자사Workspace생태계와의통합을심화함으로써기업과의관계를더욱견고하게구축하고,구글제품군을이미사용하고있는조직에게더맞춤화된연구역량을제공하려합니다.
145 조회
0 추천
11.06 등록
(퍼플렉시티가정리한기사)찰스3세국왕은어제세인트제임스궁전에서열린퀸엘리자베스공학상시상식에서CEO젠슨황에게인공지능의위험성에대한강력한경고를직접전달했으며,이는이기술의급속한발전에대한왕실의우려가커지고있음을보여준다."그가말씀하시길,당신과이야기하고싶은것이있다고하셨어요.그리고저에게편지를건네주셨습니다"라고황은11월5일시상식이후BBC에말했다.그편지에는블레츨리파크에서열린AI안전정상회의에서국왕이2023년에한연설문사본이담겨있었으며,이연설에서AI위험은"긴급성,단합,그리고집단적힘의감각"으로대처해야한다고경고했다.​AI안전성에대한왕실의강조국왕의개입은엔비디아가지난주역사적인5조달러가치평가에도달하여이이정표를달성한최초의기업이되면서이루어졌다.국왕이황에게공유하기위해직접선택한2023년연설에서AI개발을"전기의발견못지않게중요하다"고규정하면서도이기술이"선과악을위해사용될수있다"고경고했다.​"그것은AI안전에관한그의연설이었습니다.그는분명히AI안전에대해매우깊이관심을가지고계십니다"라고황은말하며,영국과세계를변화시킬AI의"놀라운능력"에대한국왕의믿음을언급했다.행사중찰스국왕은참석자들에게"주변에많은악의적인행위자들이있다"고경고하며기술출현의"빠른"속도를지적했다.​저명한수상자들이우려를공유하다Huang은2025년QEPrize를수상한6명의다른AI선구자들과함께상을받았으며,여기에는GeoffreyHinton과YoshuaBengio가포함되어있는데,이들은모두이전에AI가인류에게실존적위협이된다고경고한바있다.50만파운드의상금은"현대머신러닝"에대한그들의집단적공헌을인정한것이다.​"AI의대모"로알려진Fei-FeiLi교수는기자들에게국왕과이기술이"사람들을위해좋은일을하고,우리가위험을인식하도록하는것"에대해논의했다고말했다.시상식은정책입안자들과업계리더들을분열시킨급속한AI발전과안전문제사이의긴장을부각시켰다.​정치적및산업적맥락영국국왕의AI주의강조는트럼프행정부의접근방식과극명하게대조됩니다.트럼프행정부는AI안전정상회의를AI행동정상회의로브랜드를변경하고안전조치보다신속한개발을장려해왔습니다.황대표는최근5,000억달러규모의AI칩주문을확보했으며미국정부를위한7개의새로운슈퍼컴퓨터계획을발표했습니다.​엔비디아를포함한미국의주요기술기업들은영국전역의AI인프라에수십억달러를계속투자하고있으며,황대표는현재순간을"지금바로일어나고있는산업혁명"이라고묘사했습니다.
141 조회
0 추천
11.06 등록
(퍼플렉시티가정리한기사)ktcloud가6일국내상업용데이터센터로는처음으로리퀴드쿨링(액체냉각)기술을적용한'가산AI데이터센터'를개소했다고발표했다.이는고성능GPU발열문제해결을통해AI인프라시장선점에나선전략적행보로평가된다.​가산AIDC는연면적약1만1046평,지하5층·지상10층규모로총수전용량40MW,IT용량26MW를갖춘초거대AI인프라허브다.특히GPU칩에콜드플레이트를부착하고냉수를직접접촉시키는D2C(DirecttoChip,직접칩냉각)방식을국내최초로상용화했다.​최지웅ktcloud대표는"GPU발열량이많아내구성이떨어질수밖에없다.수명이2~3년에불과해리퀴드쿨링은필수적"이라며"온도가낮춰져야오래쓸환경이마련된다"고강조했다.​AI전용서비스로시장공략가산AIDC를통해ktcloud는국내최초의'Colo.AI'서비스를본격제공한다.이는고객맞춤형GPU서버,전용네트워크,운영플랫폼,유지보수까지모든것을포함한통합형턴키AI인프라서비스다.엔비디아B200등최신GPU기반으로구성되며,랙당최대160kW급처리가가능해엔비디아블랙웰급GPU시스템도운영할수있다.​현재국내전문AI기업과중소금융기업등이이미Colo.AI를활용해대규모AI모델학습및서비스운영을수행하고있다.최대표는"온디맨드방식이어서초기투자부담이없고,데이터센터인프라와통신망을모두갖춰경쟁력이높다"고밝혔다.​AI인프라확장계획ktcloud는가산을시작으로서부권역을포함한국내주요거점에2030년까지500MW이상규모의인프라를중장기적으로확보할계획이다.이는엔비디아가한국에GPU26만장을공급하기로한가운데,AWS가7조원규모로국내AI데이터센터를확충하는등글로벌빅테크의한국투자가본격화되는시점과맞물려있다.
136 조회
0 추천
11.06 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입