Loading...

AI 뉴스

Microsoft Azure가 GB300 GPU로 초당 110만 토큰 달성

페이지 정보

작성자 xtalfi
작성일 11.05 17:41
152 조회
0 추천
0 비추천

본문

LA_DC_60-1.jpg

(퍼플렉시티가 정리한 기사)


Microsoft는 Azure 클라우드 플랫폼에서 단일 랙 시스템으로 초당 110만 토큰이라는 전례 없는 성능을 달성하며 AI 처리 장벽을 무너뜨렸습니다. 이는 백만 토큰 임계값을 처음으로 돌파한 것으로, AI 추론 성능에 대한 새로운 업계 벤치마크를 확립했습니다.​

NVIDIA의 최첨단 GB300 GPU로 구동되는 Azure ND GB300 v6 가상 머신을 사용하여 달성한 이 이정표는 GB200 시스템으로 달성한 Microsoft의 이전 기록인 초당 865,000 토큰 대비 27% 향상된 수치입니다. 이 성능 테스트는 업계 표준인 Llama 2 70B 모델을 사용한 80분간의 벤치마크 실행 동안 Signal65에 의해 독립적으로 검증되었습니다.​


엔터프라이즈 AI를 위한 획기적인 성능

이 성과는 AI 배포의 경제성을 근본적으로 변화시켜, 기업들이 엄격한 규정 준수 요구사항을 유지하면서 수천 명의 동시 사용자를 지원할 수 있게 합니다. 각 NVIDIA GB300 GPU는 초당 15,200개의 토큰을 처리하여 이전 세대 H100 칩보다 5배의 처리량을 제공하며, Signal65가 "엘리트 AI 성능"이라고 부른 것이 이제 접근 가능한 유틸리티로 제공됨을 보여줍니다.​

Microsoft의 이 혁신은 회사가 대규모 AI 인프라 투자를 가속화하는 시기에 나왔습니다. 이 기술 대기업은 월요일에 세 건의 별도 수십억 달러 규모 AI 거래를 발표했으며, 여기에는 추가 NVIDIA GB300 용량을 위한 IREN Limited와의 97억 달러 규모 파트너십과 수만 개의 GPU 배포를 위한 Lambda와의 별도 계약이 포함됩니다.​


AI 군비 경쟁에서의 인프라 리더십

이 기록적인 성능은 이전 세대 대비 50% 더 많은 메모리와 16% 높은 열용량을 포함한 향상된 사양을 갖춘 72개의 GPU를 탑재한 단일 NVIDIA GB300 NVL72 랙에 걸쳐 18개의 가상 머신을 사용하여 달성되었습니다. 이 시스템은 가상 머신당 초당 평균 61,163개의 토큰 처리량으로 놀라운 일관성을 보여주었습니다.​

"이 성능 이정표는 NVIDIA와의 지속적인 협력을 보여주며 프로덕션 환경에서 광범위한 AI 워크로드를 관리하는 Azure의 능력을 강조합니다"라고 Microsoft CEO 사티아 나델라는 말하며, 이 성과가 Azure를 엔터프라이즈 AI 추론을 위한 최고의 플랫폼으로 자리매김하게 한다고 강조했습니다. 이 이정표는 단순한 기술적 성과 이상을 의미합니다. 산업 규모의 AI 처리가 클라우드에 도입되었음을 알리며, 대규모 내부 인프라 투자 없이도 주류 기업들이 정교한 AI 기능에 접근할 수 있게 되었습니다.

댓글 0
전체 935 / 45 페이지
(퍼플렉시티가정리한기사)인공지능경량화전문기업노타가3일코스닥상장첫날공모가대비257%급등하며투자자들의뜨거운관심을입증했다.​공모가9,100원으로책정된노타는22,500원에거래를시작해,장중3만2,500원까지치솟으며257.14%상승률을기록했다.이는올해상장한코스닥기업중가장높은첫날상승률로,시가총액6,600억원을돌파하며코스닥시장124위에오르는기염을토했다.​올해최고IPO흥행...9조원몰려노타의상장성공은이미공모단계에서예고됐다.지난달23일부터24일까지진행된일반투자자청약에서2,781.5대1의경쟁률을기록하며올해최고치를달성했다.72만9,000주배정물량에대해20억2,771만주가신청되며약9조2,261억원의청약증거금이몰렸다.​앞서기관투자자수요예측에서도국내외2,319개기관이참여해1,058대1의경쟁률을보였으며,의무보유확약비율이59.7%에달해상장후주가안정성을높였다.​AI경량화기술로글로벌기업파트너십구축2015년KAIST연구진이대전에서창업한노타는AI모델경량화·최적화플랫폼'넷츠프레소(NetsPresso)'를통해사업을전개하고있다.이기술은복잡한AI모델을최대10분의1크기로압축하고특정하드웨어에서최대40배빠른실행속도를제공한다.​엔비디아,삼성전자,퀄컴,ARM,소니등글로벌기업들과협력하며지능형교통,산업안전,첨단의료등다양한분야에서맞춤형AI솔루션을공급하고있다.올해4월에는글로벌시장조사업체CB인사이트가선정하는'글로벌혁신AI스타트업100'에이름을올리기도했다.​채명수노타대표는"최근하드웨어파편화심화와성능격차확대로AI모델경량화·최적화수요는거스를수없는시대적흐름"이라며"이번상장을계기로경량화·최적화분야글로벌톱티어기업으로도약하겠다"고밝혔다.
137 조회
0 추천
11.05 등록
(퍼플렉시티가정리한기사)네이버가엔비디아GPU6만장확보와함께피지컬AI기술력을앞세워글로벌AI시장공략에나선다.최수연네이버대표는5일3분기실적발표컨퍼런스콜에서"엔비디아와업무협약을체결하고최신그래픽처리장치6만장을추가확보했다"며"피지컬AI공략을위해현재반도체,조선,방산등많은제조업파트너사와협업을논의중"이라고밝혔다.​분기최초3조원돌파,역대최대실적달성네이버는2025년3분기매출액3조1381억원,영업이익5706억원을기록해분기기준처음으로매출3조원을돌파했다고5일발표했다.매출액은전년동기대비15.6%,영업이익은8.6%증가하며역대최대실적을달성했다.AI기반광고솔루션과개인화추천서비스강화로홈피드일평균이용자수가1000만명을돌파하는등'AI접목'효과가가시화됐다.​피지컬AI선점위해GPU에1조원투자네이버는AI인프라강화를위해공격적인투자에나선다.김희철최고재무책임자는"올해GPU를포함한전체인프라투자가1조원정도로예상되며,2026년이후피지컬AI공략등신규사업확대를감안했을때GPU에만1조원이상의투자가예상된다"고말했다.최대표는"피지컬AI라는개념이나오기전인2017년부터네이버랩스를설립해피지컬AI를위한기술을선행연구해왔다"며"해당기술들이글로벌최고수준이라자부한다"고강조했다.​네이버는로봇운영체제'아크(ARC)'와정밀내비게이션소프트웨어'얼라이크(ALIKE)'등독자기술을보유하고있다고설명했다.최대표는"향후전세계로보틱스시장의약30%이상을차지할것으로조심스럽게예측한다"며글로벌시장공략에대한자신감을나타냈다.또한2026년봄쇼핑AI에이전트출시를시작으로생성형검색경험을제공하는AI탭,통합에이전트까지순차출시할계획이라고밝혔다.​네이버의GPU확보는도널드트럼프미국대통령이"엔비디아블랙웰GPU를미국외에는누구도갖지못하게하겠다"고발언한상황에서나와주목받고있다.그러나업계에서는이발언이중국을겨냥한조치로분석하며,한국에대한26만장GPU공급약속은유지될것으로전망하고있다.
145 조회
0 추천
11.05 등록
(퍼플렉시티가정리한기사)글로벌빅테크기업들이인공지능(AI)도입확산에따른구조조정으로대규모감원을잇따라발표하고있다.IBM은4일(현지시간)4분기중전세계인력의한자릿수비율에해당하는수천명을감원하겠다고발표했다.​IBM은성명에서"우리는정기적으로인력을검토해재조정한다"며"4분기에우리는전세계인력의한자릿수비율에영향을미칠조치를시행중"이라고밝혔다.지난해말기준IBM의전체직원수는27만명으로,1%만감축하더라도2700명에달하는규모다.​AI도입가속화로빅테크감원행렬아빈드크리슈나IBMCEO체제에서IBM은AI시장성장에맞춰클라우드서비스매출을높이기위해소프트웨어부문에집중하고있다.하지만지난달소프트웨어부문매출액성장이시장기대에못미치면서주가가하락세를이어가고있는상황이다.​IBM에앞서Amazon은지난달말1만4000명을해고하는대규모인력조정을단행했다.로이터통신등에따르면아마존은총3만명규모의감원을계획하고있는것으로전해진다.앤디재시아마존CEO는"생성형AI도입으로향후몇년간사무직인력규모가줄어들것"이라는사내메시지를전달하기도했다.​Meta도10월AI부문인메타슈퍼인텔리전스랩스에서600명을감원했다고발표했다.알렉산드르왕메타최고AI책임자는내부메모에서"팀규모를줄임으로써의사결정에필요한논의가줄어들고,각개인이더큰책임과영향력을가질수있다"고설명했다.​전방위적고용시장충격미국감원추적사이트'레이오프'에따르면올해들어218개테크기업에서11만2732명이일자리를잃었다.Intel은지난4월2만2000명을감원했고,Microsoft는7월에9000명을해고했다.​세계경제포럼(WEF)은올해보고서에서"고용주의41%가AI로인한인력감축을계획중"이라며"기술변화가일자리구조를재편하고있다"고분석했다.테크기업들이AI데이터센터등인프라에막대한투자를하고있는만큼,비용절감을위한인력구조조정이계속될전망이다.
143 조회
0 추천
11.05 등록
(퍼플렉시티가정리한기사)기업중심의스테이블코인결제플랫폼인Pay3는오늘AI에이전트가디지털화폐를사용하여금융거래를자율적으로실행하고최적화할수있도록설계된에이전틱결제플랫폼(AgenticPaymentsPlatform)의출시를발표했습니다.이플랫폼은인공지능시스템이비즈니스운영에점점더통합됨에따라자율적의사결정을지원하는인프라에대한증가하는수요를해결합니다.​이번발표는기업의에이전틱AI도입이급속도로가속화되는시점에나왔습니다.가트너는2028년까지기업용소프트웨어의33%가에이전틱AI기능을포함할것으로예측하며,이는2024년의1%미만에서증가한수치입니다.또한이리서치기업은2028년까지일상업무결정의최소15%가에이전틱AI를통해자율적으로이루어질것으로전망하고있습니다.​스테이블코인이AI네이티브통화로부상하다Pay3의플랫폼은스테이블코인결제,지능형라우팅,주요블록체인전반의실시간결제를통합하여AI시스템이가격책정,청구및자금흐름을동적으로관리할수있도록지원합니다.이러한접근방식은스테이블코인이AI에이전트를위한최적의결제수단이라는업계의광범위한합의를반영합니다.​Pay3의공동창업자이자CEO인PriyaKarnik은"스테이블코인은미래의금융인프라를구축하고있습니다"라고말했습니다."Pay3에서우리는에이전틱AI와스테이블코인결제라는두가지세대적기술의교차점에있으며,금융을그어느때보다더스마트하고빠르며접근가능하게만들고있습니다."​업계전문가들은은행이모든계정뒤에인간또는법인주체를요구하기때문에전통적인은행인프라는AI에이전트를고객으로수용할수없다고주장합니다.스테이블코인은AI에이전트가은행승인없이즉시온보딩하면서달러등가성을유지할수있는퍼블릭블록체인에연결된결제시스템과가치저장수단을제공함으로써이문제를해결합니다.​Google프로토콜통합계획됨Pay3는자율적인에이전트간거래를가능하게하는Google의새로운A2A(Agent-to-Agent)오픈프로토콜을활용하여기능을확장할계획입니다.올해초50개이상의기술파트너의지원을받아발표된Google의A2A프로토콜은AI에이전트가안전하게통신하고정보를교환하며기업플랫폼전반에서작업을조율할수있도록합니다.​이프로토콜은전문지갑소프트웨어없이도기계간스테이블코인결제를가능하게하는Coinbase의x402와같은기존결제표준을보완합니다.AI에이전트가페이월을만나면서명된스테이블코인결제를요청헤더에추가하고거래를진행할수있습니다.​시장모멘텀구축Pay3의출시는에이전트결제분야의광범위한모멘텀을반영합니다.PayPal은최근Mastercard의에이전트결제플랫폼과의통합을발표했으며,Mastercard는미국카드소지자들에게AgentPay토큰을제공했습니다.한편,PayOS는9월에MastercardAgenticTokens를사용하여획기적인에이전트결제거래를완료했습니다.​스테이블코인시장은총공급량이3,000억달러를초과하고월간거래량이1.25조달러에근접하며사상최고치를기록했습니다.기업채택이가속화되고있으며,설문조사에응한기업의53%가현재또는향후스테이블코인사용을보고했습니다.​Pay3는Citi,Paytm,Yahoo,Ola및BCGDigitalVentures에서풍부한경험을쌓은PriyaKarnik과RajivThondanoor가설립했습니다.이플랫폼은국경간결제,재무최적화,그리고60개이상의국가에서300개이상의결제방법을통한스테이블코인수용을포함한기업사용사례를지원합니다.
142 조회
0 추천
11.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입