AI 뉴스

Microsoft Azure가 GB300 GPU로 초당 110만 토큰 달성

페이지 정보

작성자 xtalfi
작성일 2025.11.05 17:41
1,416 조회
0 추천
0 비추천

본문

LA_DC_60-1.jpg

(퍼플렉시티가 정리한 기사)


Microsoft는 Azure 클라우드 플랫폼에서 단일 랙 시스템으로 초당 110만 토큰이라는 전례 없는 성능을 달성하며 AI 처리 장벽을 무너뜨렸습니다. 이는 백만 토큰 임계값을 처음으로 돌파한 것으로, AI 추론 성능에 대한 새로운 업계 벤치마크를 확립했습니다.​

NVIDIA의 최첨단 GB300 GPU로 구동되는 Azure ND GB300 v6 가상 머신을 사용하여 달성한 이 이정표는 GB200 시스템으로 달성한 Microsoft의 이전 기록인 초당 865,000 토큰 대비 27% 향상된 수치입니다. 이 성능 테스트는 업계 표준인 Llama 2 70B 모델을 사용한 80분간의 벤치마크 실행 동안 Signal65에 의해 독립적으로 검증되었습니다.​


엔터프라이즈 AI를 위한 획기적인 성능

이 성과는 AI 배포의 경제성을 근본적으로 변화시켜, 기업들이 엄격한 규정 준수 요구사항을 유지하면서 수천 명의 동시 사용자를 지원할 수 있게 합니다. 각 NVIDIA GB300 GPU는 초당 15,200개의 토큰을 처리하여 이전 세대 H100 칩보다 5배의 처리량을 제공하며, Signal65가 "엘리트 AI 성능"이라고 부른 것이 이제 접근 가능한 유틸리티로 제공됨을 보여줍니다.​

Microsoft의 이 혁신은 회사가 대규모 AI 인프라 투자를 가속화하는 시기에 나왔습니다. 이 기술 대기업은 월요일에 세 건의 별도 수십억 달러 규모 AI 거래를 발표했으며, 여기에는 추가 NVIDIA GB300 용량을 위한 IREN Limited와의 97억 달러 규모 파트너십과 수만 개의 GPU 배포를 위한 Lambda와의 별도 계약이 포함됩니다.​


AI 군비 경쟁에서의 인프라 리더십

이 기록적인 성능은 이전 세대 대비 50% 더 많은 메모리와 16% 높은 열용량을 포함한 향상된 사양을 갖춘 72개의 GPU를 탑재한 단일 NVIDIA GB300 NVL72 랙에 걸쳐 18개의 가상 머신을 사용하여 달성되었습니다. 이 시스템은 가상 머신당 초당 평균 61,163개의 토큰 처리량으로 놀라운 일관성을 보여주었습니다.​

"이 성능 이정표는 NVIDIA와의 지속적인 협력을 보여주며 프로덕션 환경에서 광범위한 AI 워크로드를 관리하는 Azure의 능력을 강조합니다"라고 Microsoft CEO 사티아 나델라는 말하며, 이 성과가 Azure를 엔터프라이즈 AI 추론을 위한 최고의 플랫폼으로 자리매김하게 한다고 강조했습니다. 이 이정표는 단순한 기술적 성과 이상을 의미합니다. 산업 규모의 AI 처리가 클라우드에 도입되었음을 알리며, 대규모 내부 인프라 투자 없이도 주류 기업들이 정교한 AI 기능에 접근할 수 있게 되었습니다.

댓글 0
전체 1,366 / 84 페이지
GoogleCEO순다르피차이는인공지능이결국최고경영자역할을수행할수있을것이라고말하며,11월18일공개된BBC인터뷰에서이직책을"언젠가AI가하기에아마도더쉬운일중하나"라고설명했다.​그의발언은11월17일출시된Google의가장진보된AI모델인Gemini3발표이후나왔으며,피차이는이것이복잡한작업을자율적으로수행할수있는시스템을향한전환점이라고말했다.CEO는12개월내에AI가질문에답하는것에서사용자를대신하여행동하는에이전트로진화하여선물쇼핑,투자결정평가,의료치료옵션검토와같은작업을처리하게될것이라고예측했다.​기술리더들사이에서커지는목소리Pichai는AI가리더십기능을자동화할수있다고인정하는임원들의확대되는그룹에합류했습니다.OpenAICEOSamAltman은11월4일팟캐스트에서AI가"몇년이내"에주요기업부서를운영할것으로예상한다고말했으며"OpenAI가AICEO가운영하는첫번째대기업이아니라면부끄러운일"이라고선언했습니다.KlarnaCEOSebastianSiemiatkowski는올해초AI가"내일을포함하여우리의모든일을할수있다"고쓰면서회사직원수를7,400명에서3,000명으로줄였습니다.​모든기술리더들이동의하는것은아닙니다.NvidiaCEOJensenHuang은AI가자신을대체할수있는지묻는질문에"절대아니다"라고답했지만,이기술이모든직업에영향을미칠것임을인정했습니다.​버블우려와일자리붕괴피차이는AI의급속한성장에"비합리성의요소들"이포함되어있다고경고했으며,버블이붕괴될경우"우리를포함한어떤회사도면역되지않을것"이라고말했다.그는AI를절대적으로신뢰해서는안된다고사용자들에게주의를주면서,시스템이여전히"오류가발생하기쉽다"고지적했다.​CEO는AI발전이일부직위를없애는동시에다른직위를변화시켜광범위한적응을요구할것이라고말했다.500명의CEO를대상으로한edX설문조사에서49%가자신의직무기능대부분또는전부가AI에의해자동화되어야한다고믿는것으로나타났다.
907 조회
0 추천
2025.11.21 등록
Google은사용자가"이것이AI로생성된것인가요?"라고질문하여이미지가GoogleAI도구에의해생성되었거나수정되었는지확인할수있는기능을Gemini앱에추가하고있으며,향후에는이검증기능을동영상,오디오,그리고Google검색으로확대할계획입니다.​이기능은현재Google의독점적인보이지않는워터마킹기술인SynthID에기반하고있지만,앞으로는업계표준인C2PA(콘텐츠출처및진위연합)자격증명을지원하게되어,OpenAI의Sora를포함한더다양한AI도구에서생성된콘텐츠도탐지할수있습니다.​TikTok도이번주에AI생성콘텐츠에C2PA워터마킹을도입하겠다고발표했으나,이러한탐지시스템의보다광범위한활용은소셜미디어플랫폼이수동사용자검증이아니라자동플래그기능을개발하는데달려있습니다.
932 조회
0 추천
2025.11.21 등록
음성AI스타트업Wispr은3천만달러규모의시리즈A투자를확보한지불과5개월만에NotableCapital이주도한2,500만달러를추가로유치하여총투자금을8,100만달러로늘렸으며,이는받아쓰기앱WisprFlow가전월대비40%의성장을경험하고있다고TechCrunch가보도했다.​회사는사용자들이3개월사용후앱을통해자신의문자의50%이상을작성한다고보고하며,WisprFlow는270개의Fortune500기업에도달했고125개기업이엔터프라이즈고객으로계약했으며,OpenAI의Whisper의27%및Apple의네이티브전사기능의47%와비교하여10%의오류율을달성했다.​Wispr은투자자HansTung이"워크플로우자동화를시작할수있는음성주도운영체제"라고부르는것으로받아쓰기를넘어진화하는것을목표로하며,YC지원Willow와Aqua,Superwhisper등을포함한경쟁이치열한시장에서경쟁하고있으며,음성인식기술시장은2034년까지500억달러를초과할것으로예상된다.
944 조회
0 추천
2025.11.21 등록
Google은목요일새로운Gemini3Pro모델을기반으로구축된업그레이드된AI이미지생성도구인NanoBananaPro를출시하여,전문편집소프트웨어의경쟁자로자리매김할수있는향상된기능을제공합니다.​이번출시는화요일에공개된Gemini3Pro에이어나온것으로,8월에단4일만에1,300만명의신규사용자를유치하며입소문을탄원래NanoBanana모델의주요한계점을해결했습니다.업데이트된도구는이제2K및4K이미지해상도,16:9를포함한다양한화면비율을지원하며,최대5명의인물에대한캐릭터일관성을유지하거나14개의서로다른이미지를혼합할수있습니다.​추론능력이사용자경험을변화시킵니다Gemini2.5Flash로구동되었던이전버전과달리,NanoBananaPro는이미지를생성하기전에복잡한데이터를해석하기위해Gemini3Pro의추론능력을활용합니다."인포그래픽제작에탁월합니다.슬라이드프레젠테이션을생성할수있으며,캐릭터일관성을유지하면서최대14개의서로다른이미지또는5개의다른캐릭터를관리할수있습니다"라고GoogleLabs및Gemini의부사장인JoshWoodward가CNBC에말했습니다.​이모델은운동루틴,코드스니펫,데이터세트를분석하여시각화를생성할수있으며,단순한텍스트-이미지생성을넘어섭니다.AndroidAuthority의테스트에따르면,이도구는이제후속편집요청을효과적으로처리하는반면,원래버전은"마치디지털머리를벽에부딪히는것처럼동일한편집을반복했습니다".​OpenAI에대한전략적압박이번출시는11월12일GPT-5.1을발표한OpenAI와의경쟁이심화되는가운데이루어졌습니다.Google의Gemini앱은현재월활성사용자6억5천만명을보유하고있어,ChatGPT의주간사용자7억~8억명과의격차를좁히고있습니다.​NanoBananaPro는Gemini앱에서제한된무료할당량으로제공되며,사용자가할당량을모두소진하면원래모델로되돌아갑니다.유료구독자인GoogleAIPlus,Pro,Ultra사용자는더높은할당량을받으며,Ultra구독자는Flow비디오도구에서도액세스할수있고가시적워터마크가면제됩니다.이도구는NotebookLM,GoogleSlides,GoogleVids및GeminiAPI에도배포되고있습니다.​모든이미지에는검증목적으로Google의비가시적SynthID워터마크가포함되며,무료및Pro등급사용자에게는가시적인Gemini스파클워터마크가표시됩니다.
930 조회
0 추천
2025.11.21 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입