Loading...

AI 뉴스

Microsoft Azure가 GB300 GPU로 초당 110만 토큰 달성

페이지 정보

작성자 xtalfi
작성일 2025.11.05 17:41
1,557 조회
0 추천
0 비추천

본문

LA_DC_60-1.jpg

(퍼플렉시티가 정리한 기사)


Microsoft는 Azure 클라우드 플랫폼에서 단일 랙 시스템으로 초당 110만 토큰이라는 전례 없는 성능을 달성하며 AI 처리 장벽을 무너뜨렸습니다. 이는 백만 토큰 임계값을 처음으로 돌파한 것으로, AI 추론 성능에 대한 새로운 업계 벤치마크를 확립했습니다.​

NVIDIA의 최첨단 GB300 GPU로 구동되는 Azure ND GB300 v6 가상 머신을 사용하여 달성한 이 이정표는 GB200 시스템으로 달성한 Microsoft의 이전 기록인 초당 865,000 토큰 대비 27% 향상된 수치입니다. 이 성능 테스트는 업계 표준인 Llama 2 70B 모델을 사용한 80분간의 벤치마크 실행 동안 Signal65에 의해 독립적으로 검증되었습니다.​


엔터프라이즈 AI를 위한 획기적인 성능

이 성과는 AI 배포의 경제성을 근본적으로 변화시켜, 기업들이 엄격한 규정 준수 요구사항을 유지하면서 수천 명의 동시 사용자를 지원할 수 있게 합니다. 각 NVIDIA GB300 GPU는 초당 15,200개의 토큰을 처리하여 이전 세대 H100 칩보다 5배의 처리량을 제공하며, Signal65가 "엘리트 AI 성능"이라고 부른 것이 이제 접근 가능한 유틸리티로 제공됨을 보여줍니다.​

Microsoft의 이 혁신은 회사가 대규모 AI 인프라 투자를 가속화하는 시기에 나왔습니다. 이 기술 대기업은 월요일에 세 건의 별도 수십억 달러 규모 AI 거래를 발표했으며, 여기에는 추가 NVIDIA GB300 용량을 위한 IREN Limited와의 97억 달러 규모 파트너십과 수만 개의 GPU 배포를 위한 Lambda와의 별도 계약이 포함됩니다.​


AI 군비 경쟁에서의 인프라 리더십

이 기록적인 성능은 이전 세대 대비 50% 더 많은 메모리와 16% 높은 열용량을 포함한 향상된 사양을 갖춘 72개의 GPU를 탑재한 단일 NVIDIA GB300 NVL72 랙에 걸쳐 18개의 가상 머신을 사용하여 달성되었습니다. 이 시스템은 가상 머신당 초당 평균 61,163개의 토큰 처리량으로 놀라운 일관성을 보여주었습니다.​

"이 성능 이정표는 NVIDIA와의 지속적인 협력을 보여주며 프로덕션 환경에서 광범위한 AI 워크로드를 관리하는 Azure의 능력을 강조합니다"라고 Microsoft CEO 사티아 나델라는 말하며, 이 성과가 Azure를 엔터프라이즈 AI 추론을 위한 최고의 플랫폼으로 자리매김하게 한다고 강조했습니다. 이 이정표는 단순한 기술적 성과 이상을 의미합니다. 산업 규모의 AI 처리가 클라우드에 도입되었음을 알리며, 대규모 내부 인프라 투자 없이도 주류 기업들이 정교한 AI 기능에 접근할 수 있게 되었습니다.

댓글 0
전체 1,366 / 63 페이지
하버드대학출신인AnhPhuNguyen과CaineArdayfio는대화를지속적으로기록하고회상하는"제2의두뇌"역할을하도록설계된AI기반스마트안경Mira개발을위해660만달러의시드펀딩을유치했습니다.최근Halo에서리브랜딩한샌프란시스코기반스타트업은GeneralCatalyst로부터투자를유치했으며,NavalRavikant,PillarVC,VillageGlobal,MorningsideVentures,SomaCapital이참여했습니다.​2026년1월출시예정인이안경은MetaRay-Ban스마트안경과같은카메라중심경쟁제품과는다른방향을제시합니다.대신Mira는개인정보보호문제를해결하면서700밀리초미만의응답시간을달성하기위해오디오전사에만의존합니다.GeneralCatalyst에따르면,이시스템은대화를지속적으로듣고전사하며,듀얼웨이브가이드디스플레이를통해관련맥락을렌즈에직접표시합니다.​바이럴프라이버시경고에서투자받은스타트업으로창업자들은2024년9월MetaRay-Ban안경과안면인식기술을사용하여낯선사람을즉시식별하고개인정보를검색하는논란의여지가있는프로젝트인I-XRAY로처음주목을받았습니다.1억회이상의조회수를기록한이시연은상용제품이아닌개인정보보호인식캠페인으로기획되었습니다.Nguyen과Ardayfio는이기술을출시하는대신사람들이공개데이터베이스에서자신의정보를삭제할수있도록돕는가이드를게시했습니다.​두사람은하버드대학교를중퇴하고Mira개발에집중했으며,이를경영진,영업팀,엔지니어를포함한전문가를위한"인지코파일럿"으로포지셔닝했습니다.회사자료에따르면이안경의무게는39그램으로경쟁제품의절반이며,배터리수명은하루종일지속될것으로예상됩니다.​성장하는시장에서의프라이버시우선접근법카메라가장착된대안제품들과달리,Mira의오디오전용디자인은음성변환후즉시녹음을삭제하며,변환된텍스트는회사서버가아닌사용자의휴대폰에로컬로저장됩니다.479달러의안경은MetaRay-Ban과동일한가격대를형성하면서도다른사용사례를목표로합니다:즉각적인기억회상,60개이상의언어에대한언어번역,그리고소셜미디어통합이아닌회의맥락파악기능입니다.​이번투자는스마트안경시장이폭발적인성장을경험하는시점에이루어졌으며,2025년상반기글로벌출하량이전년대비110%급증했는데,이는주로AI기반모델에의해주도되었습니다.GeneralCatalyst의파트너AraK.는"1초미만의AI응답시간"이반응적질의가아닌능동적이고대화형지원으로의전환을나타낸다고언급했습니다.
906 조회
0 추천
2025.11.26 등록
OpenAI는화요일에ChatGPT에서별도의음성모드가필요없어졌다고발표했으며,사용자가이제지도및이미지와같은시각적콘텐츠와함께실시간대화내용을볼수있는메인채팅인터페이스에음성대화를직접통합했습니다.​모바일및웹플랫폼의모든사용자에게배포되는이번업데이트는이전에음성상호작용이애니메이션파란색구체가표시되는격리된화면에서이루어지던오랜제한사항을해결합니다.사용자는응답을보지못한채듣기만할수있었으며,ChatGPT가말한내용을텍스트로검토하려면음성모드를종료해야했습니다.​원활한멀티모달경험새로운통합기능으로사용자들은ChatGPT의텍스트입력란옆에있는파형아이콘을탭하여음성대화를시작할수있으며,말하는동안응답이나타나는것을볼수있습니다.OpenAI의시연영상에따르면,시스템은대화내용의텍스트를표시하는동시에관련시각자료를보여줄수있습니다.회사가공유한한예시에서ChatGPT는음성대화중에인기있는제과점들의지도와샌프란시스코타르틴베이커리의페이스트리사진들을표시했습니다.​OpenAI는X에올린공지에서"대화하고,답변이나타나는것을보고,이전메시지를검토하며,이미지나지도같은시각자료를실시간으로볼수있습니다"라고밝혔습니다.사용자들은텍스트입력으로다시전환하기전에음성대화를중지하려면여전히"종료"를탭해야합니다.​사용자선택보존통합음성모드는앱업데이트시기본경험이되지만,OpenAI는오디오전용경험을선호하는사용자를위해기존인터페이스를보존했습니다.이전형식을원하는사용자는설정의음성모드에서"분리모드"를활성화할수있습니다.​이변경사항은사용자가대화맥락을잃지않고음성과텍스트사이를보다유동적으로이동할수있도록하는멀티모달AI상호작용을향한OpenAI의지속적인노력을나타냅니다.Google은음성대화중오버레이로실시간비디오의특정부분을강조표시할수있는GeminiLive를통해유사한영역을탐구했습니다.
869 조회
0 추천
2025.11.26 등록
GoogleDeepMind는생물학에혁명을일으킨인공지능시스템의5주년을기념하여11월25일AlphaFold개발과정을담은장편다큐멘터리"TheThinkingGame"을YouTube에무료로공개했습니다.약90분분량의이영화는창립자DemisHassabis와그의팀이2024년노벨화학상을수상하게한50년된단백질접힘문제를해결한런던연구소의전례없는접근을제공합니다.​2017년DeepMind의세계바둑챔피언승리를기록한다큐멘터리"AlphaGo"의수상경력이있는감독GregKohs가5년에걸쳐촬영한이다큐멘터리는무료공개전2024년트라이베카페스티벌에서초연되었습니다.GoogleDeepMind의블로그에따르면,이영화는"AlphaFold팀이생물학분야의50년된거대한난제를해결했다는것을알게된순간"을포착했습니다.​체스신동에서노벨상수상자까지이다큐멘터리는하사비스가어린시절체스신동에서AI선구자로성장한여정을추적하며,DeepMind가퐁과같은비디오게임을마스터하는시스템을만드는것부터단백질구조를정확하게예측하는AlphaFold를개발하기까지의진화과정을기록합니다.스웨덴왕립과학원은2024년10월하사비스와DeepMind이사존점퍼에게"단백질구조예측"으로노벨화학상을수여했으며,이영예를계산단백질설계자데이비드베이커와공동수상했습니다.​AlphaFold의영향력은혁신적이었습니다.GoogleDeepMind에따르면,190개국의300만명이상의연구자들이2억개이상의단백질구조예측을포함한무료로제공되는AlphaFold데이터베이스를사용했습니다.이시스템은과학자들이이전에는수개월또는수년의실험실작업이필요했던것을몇분안에예측할수있게합니다.​​과학적발견을위한AI의약속Kohs는HarvardCrimson과의인터뷰에서자신의영화가"기술뒤에있는인간"에초점을맞춘다고말하며,의도적으로AI의잠재적위험성을강조하지않기로선택했다고설명했다.이다큐멘터리는대신인간의인지능력을모든영역에서동등하게구현하는AI인범용인공지능을추구하는과정에서겪은돌파구와좌절을통해팀의헌신을부각시킨다.​"AlphaFold가과학적발견을가속화할수있는AI의놀라운잠재력을보여주는첫번째증거로기억되기를바란다"고Hassabis는노벨상수상후말했다.응용분야는항생제내성이해부터플라스틱을분해하는효소설계까지다양하다.​​이영화는암호화폐거래소Coinbase에관한"Coin"과YouTube에서무료로시청할수있는그의호평받은"AlphaGo"다큐멘터리를포함하여기술선구자들을다룬Kohs의포트폴리오에합류한다.
889 조회
0 추천
2025.11.26 등록
RobinhoodCEO블라드테네브가공동창업한인공지능스타트업Harmonic이월요일14억5천만달러기업가치로시리즈C펀딩에서1억2천만달러를유치하며,아직상용제품을출시하지않았음에도불구하고유니콘지위를달성했습니다.이번라운드는RibbitCapital이주도했으며,SequoiaCapital,KleinerPerkins,IndexVentures,그리고로렌파월잡스가설립한투자회사인신규투자자EmersonCollective가참여했습니다.​이번펀딩은팔로알토에본사를둔이회사가불과14개월만에진행한세번째자금조달로,총투자금은2억9천5백만달러에이릅니다.Harmonic은인공지능의지속적인문제인할루시네이션(AI시스템이그럴듯하지만잘못된정보를생성하는현상)에집중함으로써투자자들의열광적인관심을받고있습니다.​수학을통한AI환각제거Harmonic의주력모델인Aristotle은정확성을보장하기위해형식적수학검증을사용함으로써기존AI시스템과차별화됩니다.확률적언어예측에의존하는대신,Aristotle은Lean4프로그래밍언어로추론을생성하여각단계의정확성을수학적으로검증할수있게합니다.CEOTudorAchim은Reuters와의인터뷰에서"환각현상의제거는시스템이자연어가아닌코드로추론을출력하도록요구하는우리의요구사항에서직접비롯됩니다"라고말했습니다.​7월,Aristotle은국제수학올림피아드에서금메달수준의성과를달성하며6개문제중5개를해결했습니다.이는Google및OpenAI의시스템과어깨를나란히하는벤치마크였습니다.RibbitCapital의GeneralPartner인NickShalek에따르면,"Aristotle이수학적초지능이현실세계에서달성할수있는것을계속해서입증함에따라우리의파트너십을심화하게되어자랑스럽습니다".​안전필수산업타겟팅Harmonic은항공우주,금융,자동차산업을포함하여오류가심각한결과를초래할수있는분야에서자사의기술을상용화하는것을목표로하고있습니다.현재이회사는Aristotle에대한무료API액세스를제공하고있으며,연구자와수학자들이이도구를사용하여복잡한증명을검증하고발견을가속화하고있습니다.Achim은새로운자금의상당부분이점점더발전된모델을훈련하는데필요한컴퓨팅인프라를지원하는데사용될것이라고밝혔습니다.​형식검증은이미의료기기및항공시스템과같은고위험애플리케이션에서표준으로자리잡고있으며,Harmonic의접근방식은신뢰성우려로인해주저해온위험회피분야에서AI도입을촉진할수있습니다.
884 조회
0 추천
2025.11.26 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입