Loading...

AI 뉴스

AWS, 엔비디아 블랙웰 울트라 GPU를 탑재한 AI 인스턴스 출시

페이지 정보

작성자 xtalfi
작성일 11.20 03:00
22 조회
0 추천
0 비추천

본문

inference-corp-blog-onsite-gtcdc-think-smart-blog-1280x680-4529232.png

(퍼플렉시티가 정리한 기사)


Amazon Web Services는 월요일 Nvidia의 Blackwell Ultra GPU를 탑재한 Amazon EC2 P6-B300 인스턴스의 정식 출시를 발표했으며, 이는 고성능 AI 인프라에 대한 급증하는 수요를 충족시키기 위한 클라우드 거대 기업의 최신 노력을 보여줍니다.​

새로운 인스턴스는 올해 초 출시된 AWS의 이전 세대 P6-B200 인스턴스와 비교하여 2배의 네트워킹 대역폭과 1.5배 더 많은 GPU 메모리를 제공합니다. 각 P6-B300 인스턴스는 2.1테라바이트의 고대역폭 GPU 메모리, 초당 6.4테라비트의 Elastic Fabric Adapter 네트워킹, 그리고 4테라바이트의 시스템 메모리를 갖춘 8개의 Nvidia B300 GPU를 탑재하고 있습니다.​


조 단위 매개변수 모델을 위해 설계됨

AWS에 따르면, 이 인스턴스들은 Mixture of Experts 및 멀티모달 처리와 같은 정교한 기술을 사용하는 대규모 AI 모델, 특히 수천 개의 GPU에 걸친 분산 훈련이 필요한 수조 개의 매개변수를 가진 모델을 훈련하고 배포하도록 설계되었습니다. 향상된 메모리 및 네트워킹 기능을 통해 대규모 모델이 단일 Nvidia NVLink 도메인 내에 상주할 수 있어 모델 샤딩 및 통신 오버헤드가 감소합니다.​

P6-B300 인스턴스는 FSx for Lustre와 함께 Nvidia GPUDirect Storage를 지원하여 빠른 모델 로딩을 위해 초당 최대 1.2테라비트의 처리량을 달성합니다. 이 인스턴스들은 현재 Amazon EC2 Capacity Blocks for ML 및 Savings Plans를 통해 미국 서부(오리건) 리전에서 사용할 수 있습니다.​


AI 인프라 포트폴리오 확장

이번 출시로 AWS는 경쟁사인 Microsoft와 Google과 경쟁할 수 있는 위치에 서게 되었으며, 이들 역시 Blackwell 기반 인프라를 출시한 바 있습니다. Microsoft는 11월 초 4,600개 이상의 Nvidia Blackwell Ultra GPU를 탑재한 Nvidia GB300 NVL72 시스템의 첫 번째 대규모 프로덕션 클러스터를 배포한다고 발표했습니다. Google Cloud는 10월에 Nvidia의 RTX PRO 6000 Blackwell Server Edition GPU를 탑재한 G4 가상 머신을 정식 출시했습니다.​

AWS는 12월 1일부터 5일까지 라스베이거스에서 열리는 re:Invent 컨퍼런스에서 추가적인 컨테이너 및 AI 개발 사항을 선보일 예정입니다.

댓글 0
전체 1,133 / 26 페이지
(퍼플렉시티가정리한기사)Microsoft,Nvidia,그리고Anthropic은화요일에광범위한파트너십을발표했습니다.이파트너십에따라Anthropic은Microsoft의Azure클라우드플랫폼에300억달러를투자하고,두거대기술기업은이AI스타트업에총150억달러를투자할예정이며,이는인공지능주도권을향한치열한경쟁에서가장큰규모의거래중하나입니다.​이번발표는OpenAI가Amazon과클라우드서비스조달을위해380억달러규모의계약을체결한지불과2주만에나온것으로,AI기업들이점점더강력한모델을훈련하고배포하기위해인프라에투자하는열광적인속도를보여줍니다.​삼자간거래로AI환경이재편되다이번계약에따라Anthropic은ClaudeAI모델을지원하기위해Azure로부터300억달러상당의컴퓨팅용량을구매할예정입니다.샌프란시스코에본사를둔이스타트업은초기에Nvidia의GraceBlackwell및VeraRubin칩시스템을탑재한최대1기가와트의컴퓨팅용량을활용할것입니다.​동시에Nvidia는Anthropic에최대100억달러를투자하고,Microsoft는최대50억달러를출자할예정입니다.이번파트너십에는Nvidia와Anthropic간의설계및엔지니어링협력을포함하는"심층기술파트너십"도포함되어있습니다.​이협정을통해Anthropic은대규모Azure약정에도불구하고AmazonWebServices를주요클라우드제공업체로유지할수있습니다.Amazon은2023년부터2024년사이에Anthropic에80억달러를투자했습니다.​인프라군비경쟁심화이번계약은최첨단AI개발에필요한막대한컴퓨팅수요를반영하며,주요기술기업들은2025년에만AI인프라에4,000억달러이상을지출할것으로예상됩니다.GoldmanSachs는전세계AI관련인프라지출이2030년까지3조달러에서4조달러에이를수있다고추정합니다.​이러한지출급증은특히AI기업들이아직지속가능한수익성경로를입증하지못한상황에서업계가투기적거품에빠져있는지에대한우려를불러일으켰습니다.Anthropic자체도2028년까지손익분기점을달성하지못할것으로예상하고있습니다.​그러나업계리더들은이러한구축이필요하다고주장합니다.NvidiaCEOJensenHuang은AI가실시간으로지능을생산하기위한"공장"이필요하다고주장하며,이를산업규모의인프라투자라고정당화했습니다.​이번파트너십은클라우드제공업체간경쟁이심화됨에따라세회사가AI시장에서더큰점유율을확보할수있도록합니다.Microsoft의Azure는2025년2분기에전년대비39%성장하여AmazonWebServices의17.5%성장을앞질렀습니다.
27 조회
0 추천
11.19 등록
(퍼플렉시티가정리한기사)조직들이계획을세우고독립적으로행동할수있는자율AI시스템을빠르게도입하고있으며,이번달발표된여러산업보고서에따르면상당한거버넌스격차에도불구하고현재거의3분의2가이기술을실험하고있다.11월17일에발표된Info-TechResearchGroup의AITrends2026보고서는현재58%의조직이전사적으로AI를도입하고있으며,이는2025년의26%에서증가한수치라고밝혔다.700명이상의글로벌IT리더를대상으로한설문조사를기반으로한이연구는64%의조직이분석및자동화를위해에이전틱AI를실험하고있다는것을발견했다.11월4일에발표된McKinsey의StateofAI2025보고서도유사한결과를보고했으며,62%의조직이최소한AI에이전트를실험하고있고23%는최소하나의에이전틱시스템을확장하고있다.​11월17일에발표되고116개국의2,102명의임원을대상으로조사한MITSloanManagementReview와BostonConsultingGroup의별도연구에서는35%의기업이에이전틱AI사용을시작했고44%가곧배포할계획이라는것을발견했다.이보고서는에이전틱AI를"스스로계획하고,행동하며,학습할수있는""새로운부류의시스템"으로설명하며,"다단계프로세스를실행하고진행하면서적응할수있는자율적인팀원"처럼기능한다고밝혔다.​거버넌스가빠른도입속도를따라가지못함가속화된도입에도불구하고거버넌스프레임워크는여전히미흡한상태입니다.Info-Tech의보고서에따르면AI거버넌스프레임워크를완전히구현한조직은19%에불과하며,AI위험성숙도를정기적으로측정하는조직은4개중1개미만입니다.연구결과는Info-Tech이"도입과감독사이의격차확대"라고표현한현상을보여줍니다.​Info-Tech보고서의수석저자인BillWong은"AI는대부분의조직이감독체계를적응시킬수있는속도보다빠르게발전하고있지만,리더들은이제가치와위험이분리될수없다는것을인식하고있습니다"라고말했습니다.조직의거의3분의2(63%)가AI거버넌스,데이터리터러시,리더십정렬에서기술격차를보고하고있으며,공식적인교육프로그램을갖춘조직은28%에불과합니다.​MIT/BCG연구에따르면경영진의76%가이제에이전틱AI를도구보다는동료로보고있지만,선도조직중58%만이거버넌스구조의변화를예상하고있습니다.보고서는"에이전틱AI시스템은도구(소유가능하고예측가능한)와사람(자율적이며감독이필요한)사이어딘가에위치하기때문에,거버넌스는적응적이어야합니다"라고밝히고있습니다.​도전과제에도불구하고투자가속화설문조사에참여한IT리더의거의절반(47%)이2026년에AI관련예산을20%이상증액할계획이며,주요투자분야로는거버넌스자동화,AI위험도구및인재개발이포함됩니다.Info-Tech의설문조사데이터에따르면68%의리더가현재AI위험거버넌스를최우선운영과제로식별하고있으며,이는2025년의39%에서증가한수치입니다.​Amazon,Microsoft,Google,IBM,Salesforce를포함한주요기술기업들이최근몇달동안엔터프라이즈에이전틱AI플랫폼을발표했습니다.AmazonWebServices는9월에조직이대규모로AI에이전트를배포할수있도록돕기위해BedrockAgentCore를출시했으며,Microsoft는10월에자율Copilot에이전트를발표했고,AWSProfessionalServices는11월16일에특화된AI에이전트를공개했습니다.
28 조회
0 추천
11.19 등록
(퍼플렉시티가정리한기사)영화제작자후루잭슨(HoorooJackson)은OpenAI의Sora2비디오생성모델로전체가제작된최초의장편영화인"MyBoyfriendIsaSuperhero!?"를공개했습니다.단1,000달러의예산으로제작된이슈퍼히어로로맨틱코미디는이도구가공개된지두달도채되지않아AI기반영화제작의새로운지평을대표합니다.​이영화는2025년11월17일에초연되었으며,2025년12월에스트리밍될예정입니다.사운드와음악부터작문,디자인,애니메이션,연기에이르기까지모든요소가AI를통해생성되었으며,기계에이전트가잭슨의지시하에음향효과편집을하나하나처리했습니다.​영화계의새로운지평을열다"MyBoyfriendIsaSuperhero!?"를제작방식이외에차별화하는것은관객이스토리를경험하면서Abigail이라는두명의주인공중에서선택할수있도록하는혁신적인"주인공선택"구조입니다.Jackson은"우리는영화제작방식을바꾸는것뿐만아니라관객이영화에들어가는방식도바꾸고있습니다"라고말했습니다."슈퍼히어로로맨틱코미디를그냥보는것이아니라,어떤Abigail과사랑에빠질지선택하는것입니다."​이영화는자신의상사가비밀리에자경단슈퍼히어로라는것을발견한억만장자의비서를따라가며,그녀를"비밀정체성,기업음모,그리고통제권을장악하려는AI의고위험전투"로몰아넣습니다.​Jackson의최신작품은일련의AI영화제작이정표를기반으로합니다.그는이전에2023년에최초의완전한AI장편영화로인정받은"WindowSeat"을제작했으며,2024년에는최초의AI애니메이션장편인"DreadClub:Vampire'sVerdict"를,그리고2025년에는최초의동시이중포맷출시인"AVeryLongCarriageRide"를제작했습니다.​​AI비디오도구가제작을혁신하다Sora2는2025년9월30일OpenAI가출시한모델로,회사가비디오생성분야의"GPT-3.5모멘트"라고부르는것을대표합니다.이모델은동기화된오디오,사실적인물리시뮬레이션,그리고실제영상의사람이나물체를AI생성환경에삽입할수있는기능을갖추고있습니다.​이기술은영화제작자들이창작산업에서AI의역할에대해논쟁하는가운데등장했습니다.고어버빈스키감독은최근영화제작에대한AI의침투가"우려스럽다"고말했으며,베테랑시나리오작가폴슈레이더는"최초의AI장편영화의데뷔까지이제2년남았다"고예측했지만,잭슨의작업은그미래가이미도래했음을시사합니다.​AI영화이론에대한글도발표하는잭슨은자신의접근방식을지름길이아닌"새로운형식"으로규정합니다."이것은내가뉴머신시네마라고부르는것에대한일련의증명중하나입니다—한사람,한편의영화,생각의속도로만들어지는풀스케일장편영화"라고그는말했습니다.
26 조회
0 추천
11.19 등록
(퍼플렉시티가정리한기사)AI클라우드컴퓨팅스타트업Lambda는화요일시리즈E펀딩에서15억달러이상을유치했다고발표했으며,이는GPU컴퓨팅리소스에대한수요가계속급증함에따라AI인프라부문에서가장큰규모의투자라운드중하나로기록되었다.​이번투자라운드는억만장자투자자ThomasTull과MarkWalter가이끄는지주회사TWGGlobal이주도했으며,Tull의USInnovativeTechnologyFund도참여했다.이번자본유치를통해Lambda는수천대의NvidiaGPU를갖춘자체데이터센터구축을가속화할수있게되었으며,AI학습및추론역량에대한증가하는수요를활용할수있는입지를확보하게되었다.​인프라붐속에서의급속한확장Lambda는여러방면에서공격적인확장전략을실행하면서이번자금을확보했습니다.이달초,회사는과수만대의NvidiaGPU(첨단GB300NVL72시스템포함)로구동되는AI인프라를배치하기위한수십억달러규모의계약을발표했습니다.Lambda는또한PrimeDataCenters와파트너십을맺고남부캘리포니아에GPU클러스터를배치하고미주리주캔자스시티에5억달러규모의AI팩토리를설립할계획을밝혔습니다.​Lambda의CEO인StephenBalaban은"Microsoft와8년이상협력해왔으며,이번은우리관계에서놀라운다음단계입니다"라고말했습니다.2012년에설립된이회사는장기약정없이고성능컴퓨팅에대한유연한액세스를원하는개발자및기업을대상으로"초지능클라우드(TheSuperintelligenceCloud)"로자리매김했습니다.​Lambda는CoreWeave,TogetherAI및주요클라우드제공업체와함께점점더경쟁이치열해지는시장에서경쟁하고있습니다.CoreWeave는2025년3월230억달러의가치평가로상장했으며최근556억달러의계약잔고를보고했습니다.2024년261억8천만달러규모로평가된글로벌AI인프라시장은2034년까지2,214억달러에달할것으로예상되며,연평균23.8%의성장률을보일것으로전망됩니다.​성장을위한전략적포지셔닝시리즈E는Lambda의2025년2월4억8천만달러규모의시리즈D라운드에이어진행되었으며,당시회사가치는25억달러로평가되었습니다.업계소식통에따르면Lambda는2025년5월까지연간매출5억500만달러를달성했으며,이는2024년말4억2천5백만달러에서증가한수치입니다.또한회사는MacquarieGroup으로부터5억달러규모의대출과로부터2억7천5백만달러의신용한도를포함한상당한부채금융을확보했으며,이는특히Nvidia칩구매를위한것입니다.​Lambda는유연한가격책정과함께온디맨드GPU액세스를제공함으로써차별화되며,다년계약을선호하지않는연구자와스타트업에게어필하고있습니다.회사는데이터센터전반에걸쳐100만개이상의NvidiaGPU를운영하고있습니다.
28 조회
0 추천
11.19 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입