AI 뉴스

Microsoft Azure가 GB300 GPU로 초당 110만 토큰 달성

페이지 정보

작성자 xtalfi
작성일 2025.11.05 17:41
1,060 조회
0 추천
0 비추천

본문

LA_DC_60-1.jpg

(퍼플렉시티가 정리한 기사)


Microsoft는 Azure 클라우드 플랫폼에서 단일 랙 시스템으로 초당 110만 토큰이라는 전례 없는 성능을 달성하며 AI 처리 장벽을 무너뜨렸습니다. 이는 백만 토큰 임계값을 처음으로 돌파한 것으로, AI 추론 성능에 대한 새로운 업계 벤치마크를 확립했습니다.​

NVIDIA의 최첨단 GB300 GPU로 구동되는 Azure ND GB300 v6 가상 머신을 사용하여 달성한 이 이정표는 GB200 시스템으로 달성한 Microsoft의 이전 기록인 초당 865,000 토큰 대비 27% 향상된 수치입니다. 이 성능 테스트는 업계 표준인 Llama 2 70B 모델을 사용한 80분간의 벤치마크 실행 동안 Signal65에 의해 독립적으로 검증되었습니다.​


엔터프라이즈 AI를 위한 획기적인 성능

이 성과는 AI 배포의 경제성을 근본적으로 변화시켜, 기업들이 엄격한 규정 준수 요구사항을 유지하면서 수천 명의 동시 사용자를 지원할 수 있게 합니다. 각 NVIDIA GB300 GPU는 초당 15,200개의 토큰을 처리하여 이전 세대 H100 칩보다 5배의 처리량을 제공하며, Signal65가 "엘리트 AI 성능"이라고 부른 것이 이제 접근 가능한 유틸리티로 제공됨을 보여줍니다.​

Microsoft의 이 혁신은 회사가 대규모 AI 인프라 투자를 가속화하는 시기에 나왔습니다. 이 기술 대기업은 월요일에 세 건의 별도 수십억 달러 규모 AI 거래를 발표했으며, 여기에는 추가 NVIDIA GB300 용량을 위한 IREN Limited와의 97억 달러 규모 파트너십과 수만 개의 GPU 배포를 위한 Lambda와의 별도 계약이 포함됩니다.​


AI 군비 경쟁에서의 인프라 리더십

이 기록적인 성능은 이전 세대 대비 50% 더 많은 메모리와 16% 높은 열용량을 포함한 향상된 사양을 갖춘 72개의 GPU를 탑재한 단일 NVIDIA GB300 NVL72 랙에 걸쳐 18개의 가상 머신을 사용하여 달성되었습니다. 이 시스템은 가상 머신당 초당 평균 61,163개의 토큰 처리량으로 놀라운 일관성을 보여주었습니다.​

"이 성능 이정표는 NVIDIA와의 지속적인 협력을 보여주며 프로덕션 환경에서 광범위한 AI 워크로드를 관리하는 Azure의 능력을 강조합니다"라고 Microsoft CEO 사티아 나델라는 말하며, 이 성과가 Azure를 엔터프라이즈 AI 추론을 위한 최고의 플랫폼으로 자리매김하게 한다고 강조했습니다. 이 이정표는 단순한 기술적 성과 이상을 의미합니다. 산업 규모의 AI 처리가 클라우드에 도입되었음을 알리며, 대규모 내부 인프라 투자 없이도 주류 기업들이 정교한 AI 기능에 접근할 수 있게 되었습니다.

댓글 0
전체 1,366 / 167 페이지
(퍼플렉시티가정리한기사)한성숙중소벤처기업부장관이5일취임100일을맞아"회복을넘어성장"으로정책방향을전환하며벤처투자시장40조원조성과매년6000개창업기업육성을골자로한중소기업성장정책을본격추진한다고발표했다.​한장관은이날서울강남구팁스타운S1에서열린취임100일기자간담회에서"취임후100일간은회복에집중했다면앞으로는중소기업·소상공인의성장에집중하겠다"며향후정책방향으로△어게인벤처붐△중소기업스케일업△활기찬소상공인△연결·융합의생태계조성등4대과제를제시했다고전자신문이보도했다.​연기금출자허용으로민간투자활성화벤처투자시장40조원조성의핵심은민간투자촉진이다.현재국내벤처투자규모가연간약12조원수준인점을감안하면3배이상확대하는목표다.중기부는연기금·퇴직연금의벤처펀드출자를허용하고금융권과일반국민이참여할수있는투자제도를신설할계획이라고발표했다.​모태펀드출자예산도현재1조원규모에서2배이상확대하고존속기한을연장한다.한장관은"벤처투자활성화를위한제도개선과세제인센티브등종합대책에구체적으로반영하려고노력하고있다"며"코스닥시장활성화등금융제도개편도관계부처와협의중"이라고설명했다.​청년창업가1000개사,TIPS선정기업1200개사등유망창업기업을매년6000개사이상육성해'모두의창업'시대를개막한다는계획도밝혔다.AI·딥테크벤처·스타트업집중육성을위해13조5000억원의'넥스트유니콘프로젝트'를내년에본격가동한다.역대최대R&D예산으로기술사업화가속중기부는역대최대규모인2조2000억원의R&D예산을확보했다.이중1조1000억원을TIPS방식R&D로추진해벤처캐피털이선투자한스타트업을정부가성장단계별로매칭지원한다.​한국형미국식중소기업기술이전프로그램(STTR)제도신설등기술사업화를위한R&D에도2000억원을배정했다.뿌리부터첨단까지지역기반인공지능전환(AX)대전환을추진하며,AI중심스마트공장1만2000개를기업수준에맞게맞춤형으로보급할계획이다.​제조AI기술을공급하는전문기업을500개사육성하고제조AIR&D도추진해제조AI솔루션을매년100개이상발굴한다는목표도제시했다.중소기업성장사다리강화를위해제3자M&A방식의기업승계를활성화하는'M&A형기업승계특별법'제정도추진한다.​소상공인지원을위해서는대출보유소상공인약300만명을지속모니터링하면서선제적으로위기징후를포착한후경영진단을통해위기수준을분석하고,정책자금지원부터채무조정,재취업까지원스톱으로지원하는체계를구축한다고밝혔다.​한장관은"중소기업과소상공인이단순한회복을넘어자생적성장을이루는구조를만들겠다"며"중기부가현장과정책을잇는'성장생태계의허브'역할을다하겠다"고강조했다.
1177 조회
0 추천
2025.11.05 등록
(퍼플렉시티가정리한기사)인공지능경량화전문기업노타가3일코스닥상장첫날공모가대비257%급등하며투자자들의뜨거운관심을입증했다.​공모가9,100원으로책정된노타는22,500원에거래를시작해,장중3만2,500원까지치솟으며257.14%상승률을기록했다.이는올해상장한코스닥기업중가장높은첫날상승률로,시가총액6,600억원을돌파하며코스닥시장124위에오르는기염을토했다.​올해최고IPO흥행...9조원몰려노타의상장성공은이미공모단계에서예고됐다.지난달23일부터24일까지진행된일반투자자청약에서2,781.5대1의경쟁률을기록하며올해최고치를달성했다.72만9,000주배정물량에대해20억2,771만주가신청되며약9조2,261억원의청약증거금이몰렸다.​앞서기관투자자수요예측에서도국내외2,319개기관이참여해1,058대1의경쟁률을보였으며,의무보유확약비율이59.7%에달해상장후주가안정성을높였다.​AI경량화기술로글로벌기업파트너십구축2015년KAIST연구진이대전에서창업한노타는AI모델경량화·최적화플랫폼'넷츠프레소(NetsPresso)'를통해사업을전개하고있다.이기술은복잡한AI모델을최대10분의1크기로압축하고특정하드웨어에서최대40배빠른실행속도를제공한다.​엔비디아,삼성전자,퀄컴,ARM,소니등글로벌기업들과협력하며지능형교통,산업안전,첨단의료등다양한분야에서맞춤형AI솔루션을공급하고있다.올해4월에는글로벌시장조사업체CB인사이트가선정하는'글로벌혁신AI스타트업100'에이름을올리기도했다.​채명수노타대표는"최근하드웨어파편화심화와성능격차확대로AI모델경량화·최적화수요는거스를수없는시대적흐름"이라며"이번상장을계기로경량화·최적화분야글로벌톱티어기업으로도약하겠다"고밝혔다.
1144 조회
0 추천
2025.11.05 등록
(퍼플렉시티가정리한기사)네이버가엔비디아GPU6만장확보와함께피지컬AI기술력을앞세워글로벌AI시장공략에나선다.최수연네이버대표는5일3분기실적발표컨퍼런스콜에서"엔비디아와업무협약을체결하고최신그래픽처리장치6만장을추가확보했다"며"피지컬AI공략을위해현재반도체,조선,방산등많은제조업파트너사와협업을논의중"이라고밝혔다.​분기최초3조원돌파,역대최대실적달성네이버는2025년3분기매출액3조1381억원,영업이익5706억원을기록해분기기준처음으로매출3조원을돌파했다고5일발표했다.매출액은전년동기대비15.6%,영업이익은8.6%증가하며역대최대실적을달성했다.AI기반광고솔루션과개인화추천서비스강화로홈피드일평균이용자수가1000만명을돌파하는등'AI접목'효과가가시화됐다.​피지컬AI선점위해GPU에1조원투자네이버는AI인프라강화를위해공격적인투자에나선다.김희철최고재무책임자는"올해GPU를포함한전체인프라투자가1조원정도로예상되며,2026년이후피지컬AI공략등신규사업확대를감안했을때GPU에만1조원이상의투자가예상된다"고말했다.최대표는"피지컬AI라는개념이나오기전인2017년부터네이버랩스를설립해피지컬AI를위한기술을선행연구해왔다"며"해당기술들이글로벌최고수준이라자부한다"고강조했다.​네이버는로봇운영체제'아크(ARC)'와정밀내비게이션소프트웨어'얼라이크(ALIKE)'등독자기술을보유하고있다고설명했다.최대표는"향후전세계로보틱스시장의약30%이상을차지할것으로조심스럽게예측한다"며글로벌시장공략에대한자신감을나타냈다.또한2026년봄쇼핑AI에이전트출시를시작으로생성형검색경험을제공하는AI탭,통합에이전트까지순차출시할계획이라고밝혔다.​네이버의GPU확보는도널드트럼프미국대통령이"엔비디아블랙웰GPU를미국외에는누구도갖지못하게하겠다"고발언한상황에서나와주목받고있다.그러나업계에서는이발언이중국을겨냥한조치로분석하며,한국에대한26만장GPU공급약속은유지될것으로전망하고있다.
1036 조회
0 추천
2025.11.05 등록
(퍼플렉시티가정리한기사)글로벌빅테크기업들이인공지능(AI)도입확산에따른구조조정으로대규모감원을잇따라발표하고있다.IBM은4일(현지시간)4분기중전세계인력의한자릿수비율에해당하는수천명을감원하겠다고발표했다.​IBM은성명에서"우리는정기적으로인력을검토해재조정한다"며"4분기에우리는전세계인력의한자릿수비율에영향을미칠조치를시행중"이라고밝혔다.지난해말기준IBM의전체직원수는27만명으로,1%만감축하더라도2700명에달하는규모다.​AI도입가속화로빅테크감원행렬아빈드크리슈나IBMCEO체제에서IBM은AI시장성장에맞춰클라우드서비스매출을높이기위해소프트웨어부문에집중하고있다.하지만지난달소프트웨어부문매출액성장이시장기대에못미치면서주가가하락세를이어가고있는상황이다.​IBM에앞서Amazon은지난달말1만4000명을해고하는대규모인력조정을단행했다.로이터통신등에따르면아마존은총3만명규모의감원을계획하고있는것으로전해진다.앤디재시아마존CEO는"생성형AI도입으로향후몇년간사무직인력규모가줄어들것"이라는사내메시지를전달하기도했다.​Meta도10월AI부문인메타슈퍼인텔리전스랩스에서600명을감원했다고발표했다.알렉산드르왕메타최고AI책임자는내부메모에서"팀규모를줄임으로써의사결정에필요한논의가줄어들고,각개인이더큰책임과영향력을가질수있다"고설명했다.​전방위적고용시장충격미국감원추적사이트'레이오프'에따르면올해들어218개테크기업에서11만2732명이일자리를잃었다.Intel은지난4월2만2000명을감원했고,Microsoft는7월에9000명을해고했다.​세계경제포럼(WEF)은올해보고서에서"고용주의41%가AI로인한인력감축을계획중"이라며"기술변화가일자리구조를재편하고있다"고분석했다.테크기업들이AI데이터센터등인프라에막대한투자를하고있는만큼,비용절감을위한인력구조조정이계속될전망이다.
1032 조회
0 추천
2025.11.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입