AI 뉴스

Microsoft Azure가 GB300 GPU로 초당 110만 토큰 달성

페이지 정보

작성자 xtalfi
작성일 2025.11.05 17:41
1,082 조회
0 추천
0 비추천

본문

LA_DC_60-1.jpg

(퍼플렉시티가 정리한 기사)


Microsoft는 Azure 클라우드 플랫폼에서 단일 랙 시스템으로 초당 110만 토큰이라는 전례 없는 성능을 달성하며 AI 처리 장벽을 무너뜨렸습니다. 이는 백만 토큰 임계값을 처음으로 돌파한 것으로, AI 추론 성능에 대한 새로운 업계 벤치마크를 확립했습니다.​

NVIDIA의 최첨단 GB300 GPU로 구동되는 Azure ND GB300 v6 가상 머신을 사용하여 달성한 이 이정표는 GB200 시스템으로 달성한 Microsoft의 이전 기록인 초당 865,000 토큰 대비 27% 향상된 수치입니다. 이 성능 테스트는 업계 표준인 Llama 2 70B 모델을 사용한 80분간의 벤치마크 실행 동안 Signal65에 의해 독립적으로 검증되었습니다.​


엔터프라이즈 AI를 위한 획기적인 성능

이 성과는 AI 배포의 경제성을 근본적으로 변화시켜, 기업들이 엄격한 규정 준수 요구사항을 유지하면서 수천 명의 동시 사용자를 지원할 수 있게 합니다. 각 NVIDIA GB300 GPU는 초당 15,200개의 토큰을 처리하여 이전 세대 H100 칩보다 5배의 처리량을 제공하며, Signal65가 "엘리트 AI 성능"이라고 부른 것이 이제 접근 가능한 유틸리티로 제공됨을 보여줍니다.​

Microsoft의 이 혁신은 회사가 대규모 AI 인프라 투자를 가속화하는 시기에 나왔습니다. 이 기술 대기업은 월요일에 세 건의 별도 수십억 달러 규모 AI 거래를 발표했으며, 여기에는 추가 NVIDIA GB300 용량을 위한 IREN Limited와의 97억 달러 규모 파트너십과 수만 개의 GPU 배포를 위한 Lambda와의 별도 계약이 포함됩니다.​


AI 군비 경쟁에서의 인프라 리더십

이 기록적인 성능은 이전 세대 대비 50% 더 많은 메모리와 16% 높은 열용량을 포함한 향상된 사양을 갖춘 72개의 GPU를 탑재한 단일 NVIDIA GB300 NVL72 랙에 걸쳐 18개의 가상 머신을 사용하여 달성되었습니다. 이 시스템은 가상 머신당 초당 평균 61,163개의 토큰 처리량으로 놀라운 일관성을 보여주었습니다.​

"이 성능 이정표는 NVIDIA와의 지속적인 협력을 보여주며 프로덕션 환경에서 광범위한 AI 워크로드를 관리하는 Azure의 능력을 강조합니다"라고 Microsoft CEO 사티아 나델라는 말하며, 이 성과가 Azure를 엔터프라이즈 AI 추론을 위한 최고의 플랫폼으로 자리매김하게 한다고 강조했습니다. 이 이정표는 단순한 기술적 성과 이상을 의미합니다. 산업 규모의 AI 처리가 클라우드에 도입되었음을 알리며, 대규모 내부 인프라 투자 없이도 주류 기업들이 정교한 AI 기능에 접근할 수 있게 되었습니다.

댓글 0
전체 1,366 / 179 페이지
(퍼플렉시티가정리한기사)오픈AI의생성형인공지능챗GPT가국내에서월간활성사용자1300만명을넘어서며새로운이정표를세웠지만,신규설치건수는8개월만에100만건아래로떨어지면서국내AI시장의포화상태를시사하고있다.4일아이지에이웍스의모바일인덱스에따르면,챗GPT의10월국내월간활성사용자수(MAU)는1304만8025명으로집계되며모바일인덱스기준처음으로1300만명을돌파했다.이는지난3월500만명선에불과하던수치에서8개월만에2.6배증가한것이다.​신규설치급감,시장포화신호하지만10월신규설치건수는94만3153건으로전월134만8320건대비3분의2수준으로급감했다.신규설치가100만건을밑돈것은올해2월이후8개월만으로,4월466만8381건을정점으로지속적인하락세를보이고있다.​정보통신기술(ICT)업계에서는챗GPT국내이용자가사실상포화상태에진입했다는분석이나오고있다.한국은글로벌적으로도주목받는AI시장으로,오픈AI에따르면한국은유료챗GPT구독자수에서미국에이어전세계2위를기록하고있다.​카카오톡통합으로새로운전환점시장포화상황에서도주목할변화는지난10월말카카오톡에챗GPT가통합된점이다.사용자들은별도앱다운로드없이카카오톡채팅탭에서직접챗GPT에접근할수있게됐다.이러한통합으로신규설치유인은줄어들지만,사용자접근성은크게향상될것으로예상된다.​카카오는이번통합을통해연말까지챗GPT플러스신규구독자에게1개월환급프로모션을진행하고있으며,향후사용자증가에긍정적영향을미칠것으로전망된다.​글로벌적으로챗GPT는9월기준8억명의주간활성사용자를보유하고있으며,오픈AI는2025년말까지10억명달성을목표로하고있다.한편오픈AI는2027년을목표로최대1조달러규모의기업공개(IPO)를준비중인것으로알려졌다.
1118 조회
0 추천
2025.11.04 등록
(퍼플렉시티가정리한기사)한미반도체가차세대고대역폭메모리(HBM)생산을위한핵심장비'와이드TC본더'를2026년말출시한다고4일발표했다.이장비는업계가HBM5세대부터본격적용할것으로예상되는와이드HBM기술에최적화돼있다.​TC본더는인공지능(AI)반도체용HBM제조에필요한핵심장비로,D램다이를수직으로쌓아올릴때정밀한열과압력을가해접합하는공정에사용된다.한미반도체는현재HBM생산용TC본더시장에서전세계1위를차지하고있으며,HBM장비관련120여건의특허를보유하고있다.​와이드HBM으로기술방향전환최근메모리업계는차세대HBM에서D램다이사이즈를수평으로확대한'와이드HBM'개발을추진하고있다.HBM이고도화될수록더많은메모리용량과빠른데이터처리속도가요구되는데,20단이상고적층하는방식대신다이면적자체를확대하는방향으로개발중이다.​HBM다이면적이넓어지면실리콘관통전극(TSV)수와입출력인터페이스(I/O)수를안정적으로늘릴수있다.또한D램다이와인터포저를연결하는마이크로범프수도증가해메모리용량과대역폭을확보하면서도고적층방식대비열관리가용이하고전력효율도개선할수있다.​플럭스리스본딩기술적용새로운와이드TC본더는플럭스리스본딩기능을옵션으로추가할수있다.플럭스리스본딩은플럭스없이칩표면의산화막을감소시키는차세대접합기술로,기존방식대비잔류물세정공정이불필요해공정이단순화되고접합강도를높이면서도HBM두께를줄일수있다는장점이있다.​업계에서는와이드TC본더도입에따라차세대HBM의고적층생산을위해검토됐던하이브리드본더도입시기가한층늦춰질것으로전망하고있다.SK하이닉스는최근HBM5와HBM5E를2029년부터2031년사이에출시할계획이라고발표했다.​곽동신한미반도체회장은"HBM기술변화에발맞춰신기술을적용한와이드TC본더장비를선도적으로공급할계획"이라며"고객사의차세대HBM생산경쟁력강화에기여할것"이라고말했다.
1101 조회
0 추천
2025.11.04 등록
(퍼플렉시티가정리한기사)Google는2025년11월3일플로리다주립대학교및아칸소주와새로운교육파트너십을발표하여,전국의학생과근로자들에게무료AI기반교육을제공하는AIforEducationAccelerator프로그램을확대했습니다.플로리다주립대학교는GooglePeopleManagementEssentials인증프로그램을제공하는전국최초의교육기관중하나가되었으며,이는Gemini및NotebookLM과같은AI도구를사용하여리더십기술을가르치도록설계된8시간분량의자기주도학습과정입니다.Google의SchoolforLeaders가개발한이프로그램은SMART목표설정,프로젝트계획개발,커뮤니케이션맞춤화를포함한관리업무를위한인공지능실습경험을제공합니다.​대학들이AI교육통합에박차를가하다"우리는세계에서가장저명한기술기업중하나인Google과의파트너십과그것이우리학생들에게제공할혜택에대해기쁘게생각합니다"라고FSU경영대학학장MichaelD.Hartline이말했다.이대학교는플로리다에서Google의교육용AI가속기프로그램에참여하는유일한R1연구기관으로선정되었다.​동시에아칸소주는주상무부를통해Google과의파트너십을발표하여수요가높은기술분야의온라인직업훈련프로그램에대한무료액세스를제공한다고밝혔다.이이니셔티브에는GoogleAIEssentials와GooglePromptingEssentials를다루는새로운5시간분량의AI모듈이포함되어있으며,참가자들에게책임감있는AI관행과생성도구를위한효과적인프롬프트설계를가르친다.​18세이상의아칸소주민들은주의인력훈련네트워크를통해사이버보안,데이터분석,IT지원,디지털마케팅,프로젝트관리및사용자경험디자인분야의자격증을무료로취득할수있다.이파트너십은올해초발표된Google의웨스트멤피스40억달러규모데이터센터투자에이어이루어졌다.​디지털역량확대이니셔티브유사한파트너십이여러주에걸쳐나타나고있으며,오클라호마,테네시,메릴랜드,노스캐롤라이나가대학시스템과인력센터를통해비슷한프로그램을시작했습니다.이러한협력은2025년8월에발표된구글의10억달러규모AI교육투자약속을반영하며,이미100개이상의대학들이AIforEducationAccelerator프로그램에참여하고있습니다.​"구글에서우리는관리자에대한투자가모든사람을위한보다효과적이고협력적이며지원적인환경을조성하고비즈니스성과를이끌어낸다는것을직접경험했습니다"라고구글의최고학습책임자인브라이언글레이저는말했습니다.구글은학생들이최초의"AI네이티브"세대가되는동시에AI주도경제를위한인력준비의선두주자로자리매김하고있습니다.​11월발표는교육기관들이점점더경쟁이치열해지는취업시장에서기술중심직업을위해학생과근로자를준비시키기위해AI교육프로그램의도입이가속화되고있음을보여줍니다.
1166 조회
0 추천
2025.11.04 등록
(퍼플렉시티가정리한기사)애플이전화및페이스타임앱'실시간번역'기능이한국어,중국어(간체및번체),일본어를새롭게지원한다고4일밝혔다.이로써서로다른언어를사용하는사용자들이에어팟을통해자연스럽게소통할수있게됐다.​에어팟모델별지원및기능에어팟프로3,에어팟프로2,에어팟4액티브노이즈캔슬링(ANC)모델에서실시간번역기능을베타버전으로이용할수있다.이기능은애플인텔리전스및첨단컴퓨테이셔널오디오기술로구동된다.​에어팟사용자가말을하면상대방의언어로즉시번역되며,상대방의답변또한사용자의선호언어로실시간번역되어들려준다.두사람모두아이폰에서실시간번역을활성화하면ANC기능이상대의음성을줄여번역에집중하면서도자연스러운대화를유지할수있다.​앱별활용범위확대실시간번역기능은메시지,전화,페이스타임앱에서도사용할수있다.메시지앱에서는사용자가입력중인답장이자동으로번역되어상대방의언어로전송된다.전화앱에서는통화내용을번역된음성으로듣거나화면에서전사문형태로확인할수있으며,페이스타임에서는상대의목소리를들으며동시에번역된실시간자막을볼수있다.​에어팟을착용하지않은상대와대화할때는아이폰화면을통해번역된전사문을실시간으로확인할수있어언어가다른사용자간에도원활한의사소통이가능하다.모든실시간번역과정은온디바이스방식으로처리되어사용자의사적인대화내용이보호된다.
1095 조회
0 추천
2025.11.04 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입