AI 뉴스

AWS, 엔비디아 블랙웰 울트라 GPU를 탑재한 AI 인스턴스 출시

페이지 정보

작성자 xtalfi
작성일 11.20 03:00
13 조회
0 추천
0 비추천

본문

inference-corp-blog-onsite-gtcdc-think-smart-blog-1280x680-4529232.png

(퍼플렉시티가 정리한 기사)


Amazon Web Services는 월요일 Nvidia의 Blackwell Ultra GPU를 탑재한 Amazon EC2 P6-B300 인스턴스의 정식 출시를 발표했으며, 이는 고성능 AI 인프라에 대한 급증하는 수요를 충족시키기 위한 클라우드 거대 기업의 최신 노력을 보여줍니다.​

새로운 인스턴스는 올해 초 출시된 AWS의 이전 세대 P6-B200 인스턴스와 비교하여 2배의 네트워킹 대역폭과 1.5배 더 많은 GPU 메모리를 제공합니다. 각 P6-B300 인스턴스는 2.1테라바이트의 고대역폭 GPU 메모리, 초당 6.4테라비트의 Elastic Fabric Adapter 네트워킹, 그리고 4테라바이트의 시스템 메모리를 갖춘 8개의 Nvidia B300 GPU를 탑재하고 있습니다.​


조 단위 매개변수 모델을 위해 설계됨

AWS에 따르면, 이 인스턴스들은 Mixture of Experts 및 멀티모달 처리와 같은 정교한 기술을 사용하는 대규모 AI 모델, 특히 수천 개의 GPU에 걸친 분산 훈련이 필요한 수조 개의 매개변수를 가진 모델을 훈련하고 배포하도록 설계되었습니다. 향상된 메모리 및 네트워킹 기능을 통해 대규모 모델이 단일 Nvidia NVLink 도메인 내에 상주할 수 있어 모델 샤딩 및 통신 오버헤드가 감소합니다.​

P6-B300 인스턴스는 FSx for Lustre와 함께 Nvidia GPUDirect Storage를 지원하여 빠른 모델 로딩을 위해 초당 최대 1.2테라비트의 처리량을 달성합니다. 이 인스턴스들은 현재 Amazon EC2 Capacity Blocks for ML 및 Savings Plans를 통해 미국 서부(오리건) 리전에서 사용할 수 있습니다.​


AI 인프라 포트폴리오 확장

이번 출시로 AWS는 경쟁사인 Microsoft와 Google과 경쟁할 수 있는 위치에 서게 되었으며, 이들 역시 Blackwell 기반 인프라를 출시한 바 있습니다. Microsoft는 11월 초 4,600개 이상의 Nvidia Blackwell Ultra GPU를 탑재한 Nvidia GB300 NVL72 시스템의 첫 번째 대규모 프로덕션 클러스터를 배포한다고 발표했습니다. Google Cloud는 10월에 Nvidia의 RTX PRO 6000 Blackwell Server Edition GPU를 탑재한 G4 가상 머신을 정식 출시했습니다.​

AWS는 12월 1일부터 5일까지 라스베이거스에서 열리는 re:Invent 컨퍼런스에서 추가적인 컨테이너 및 AI 개발 사항을 선보일 예정입니다.

댓글 0
전체 1,117 / 11 페이지
(퍼플렉시티가정리한기사)MetaPlatforms,Inc.는오늘오픈소스컴퓨터비전모델컬렉션인SegmentAnythingCollection의최신버전인SAM3와SAM3D를발표했으며,텍스트기반객체감지및3D재구성기능을도입하여비디오편집및콘텐츠제작워크플로우를혁신할것이라고밝혔습니다.​이번릴리스는사용자가수동선택이아닌자연어프롬프트를사용하여객체를감지하고분할할수있도록함으로써이전SegmentAnything모델과는다른방향을제시합니다.Meta의발표에따르면,SAM3는"노란색스쿨버스"또는"빨간야구모자를쓰지않고앉아있는사람들"과같은텍스트문구로설명된객체의모든인스턴스를식별할수있습니다.SAM3D는단일이미지에서객체,사람및장면의3차원모델을재구성합니다.​텍스트프롬프트와향상된정확도SAM3는Meta의연구논문에따르면LVIS벤치마크에서47.0의제로샷마스크평균정밀도를달성하여기존시스템대비22%향상된성능을나타냅니다.이모델은H200GPU에서프레임당약30밀리초로이미지를처리하며동시에100개이상의객체를처리합니다.​Meta는발표에서"SAM3는이러한제한을극복하여훨씬더광범위한텍스트프롬프트를수용합니다"라고밝혔습니다.회사는Roboflow와협력하여개발자들이특정애플리케이션을위해데이터에주석을달고,미세조정하며,SAM3를배포할수있도록했습니다.​메타제품전반에걸친즉각적인통합Meta는이미자사의제품생태계전반에두모델을배포하고있습니다.SAM3는회사의Edits비디오제작앱과Vibes플랫폼에서새로운효과를지원하여,크리에이터들이콘텐츠내특정객체에수정을적용할수있도록합니다.SAM3D는FacebookMarketplace의새로운"방에서보기"기능을구현하여,사용자들이구매전에가구및홈데코아이템을자신의공간에서시각화할수있도록돕습니다.​​두모델모두Meta의새로운SegmentAnythingPlayground플랫폼을통해접근할수있으며,기술적전문지식이필요하지않습니다.Meta는SAM3모델가중치,평가벤치마크및연구논문을공개하고있으며,SAM3D모델체크포인트와추론코드는연구커뮤니티와공유되고있습니다.
10 조회
0 추천
11.20 등록
(퍼플렉시티가정리한기사)OpenAI는월요일에GPT-5.1-Codex-Max를출시하며,복잡한다중시간프로그래밍프로젝트를다루는개발자들을위한획기적인최신에이전틱코딩모델로포지셔닝했습니다.내부적으로24시간개발작업을완료한것으로알려진이모델은컨텍스트를잃지않고수백만개의토큰에걸쳐일관되게작동할수있도록하는"압축(compaction)"기술을도입했습니다.​이번출시는Google이Gemini3Pro를공개한지하루만에이루어져,개발자도구시장에서AI거대기업들간의경쟁을심화시키고있습니다.OpenAI의발표에따르면,GPT-5.1-Codex-Max는이제모든Codex플랫폼에서GPT-5.1-Codex를대체하는기본모델이되었습니다.​성능향상및벤치마크결과GPT-5.1-Codex-Max는표준소프트웨어엔지니어링벤치마크인SWE-BenchVerified에서77.9%의정확도를달성하여,Gemini3Pro의보고된76.2%를근소하게앞질렀습니다.이모델은또한SWE-LancerICSWE에서79.9%를기록하여이전버전의66.3%와비교되며,TerminalBench2.0에서는58.1%에도달했습니다.​벤치마크점수를넘어,이모델은실질적인효율성개선을제공합니다.OpenAI는GPT-5.1-Codex-Max가실제코딩작업을완료할때GPT-5.1-Codex보다약30%적은토큰을사용하면서27%에서42%더빠르게작업을완료한다고보고합니다.ZDNET에따르면,이러한효율성향상은사용량제한이있는ChatGPTPlus구독자들에게잠재적으로추가1시간의프로그래밍시간으로환산됩니다.​압축시스템은주요아키텍처발전을나타내며,컨텍스트한계에접근할때필수정보를유지하면서세션기록을자동으로압축할수있게합니다.TheDecoder에따르면"모델이컨텍스트창을채우면자동으로세션기록을압축합니다".OpenAI의시스템카드는이모델이"압축이라는프로세스를통해여러컨텍스트창에걸쳐작동하도록기본적으로훈련된최초의모델"이라고명시합니다.​가용성및내부채택GPT-5.1-Codex-Max는ChatGPTPlus,Pro,Business,Edu및Enterprise사용자를위한Codex를통해즉시사용할수있습니다.OpenAI에따르면API액세스는"곧"제공될예정입니다.이모델은또한Windows환경에최적화된최초의Codex버전입니다.​OpenAI내부채택률은상당합니다.회사의10월발표에따르면,OpenAI엔지니어의95%가매주Codex를사용하고있으며,이도구를채택하기전과비교하여현재70%더많은풀리퀘스트를병합하고있습니다.OpenAI는"7월에절반을조금넘었던것에비해오늘날거의모든엔지니어가Codex를사용합니다"라고밝혔습니다.​이모델은프롬프트인젝션및데이터유출을포함한보안위험을완화하기위해기본적으로네트워크액세스가비활성화된샌드박스환경내에서작동합니다.
10 조회
0 추천
11.20 등록
(퍼플렉시티가정리한기사)Google은이번주자율에이전트를통해소프트웨어개발을혁신하겠다는야심찬AI기반개발플랫폼Antigravity를공개했지만,초기사용자들은무료프리뷰를둘러싼초기흥분을가라앉힌상당한기술적장애물에직면하고있습니다.기술적문제가출시를방해하다11월17일Gemini3AI모델과함께발표된이플랫폼은빠른크레딧소진과신뢰성문제로비판을받고있습니다.HackerNews의사용자들은집중적으로사용한지약20분만에크레딧이소진되었으며,추가할당량을구매할수있는방법이없다고보고했습니다.한개발자는"내프로젝트에사용하기시작했는데약20분후에—오,안돼.크레딧이다떨어졌어요"라고쓰면서,경쟁플랫폼인Cursor로다시전환했다고덧붙였습니다.​기술저널리스트SimonWillison은테스트중에"모델공급자과부하로인해에이전트실행이종료되었습니다.나중에다시시도해주세요"라는오류메시지를받았다고기록했습니다.DevClass출판물도유사한문제를겪었으며,에이전트매니저가무한정사용중표시를나타내다가과부하메시지와함께종료되었습니다.​VisualStudioCode의포크로구축된Antigravity는AI에이전트가코드편집기,터미널및Chrome브라우저전반에걸쳐자율적으로작동하는"에이전트우선"개발패러다임을도입합니다.이플랫폼은Gemini3Pro,Anthropic의ClaudeSonnet4.5,OpenAIGPT-OSS를포함한여러AI모델을지원합니다.Google엔지니어KevinHou는이시스템이작업을위한세가지주요인터페이스를제공한다고설명했습니다:에이전트매니저창,코드편집기,자동화된브라우저.​보안우려사항및설계선택플랫폼의이용약관은"Antigravity는특정보안제한사항이있는것으로알려져있다"고명시적으로경고하며,데이터유출과코드실행을구체적인위험으로식별하고있습니다.이러한경고에도불구하고,기본구성은"에이전트지원개발"모드로작동하며,여기서AI는어떤작업이사람의승인을필요로하는지자율적으로결정합니다.​"이용약관은민감한데이터처리를피하고에이전트가수행하는모든작업을검증할것을권고합니다.하지만Google이이를진지하게받아들였다면에이전트에게상당한자율성을부여하는제품기본값을설정하지않았을것이라고생각할수있습니다"라고DevClass는언급했습니다.​추가적인문제점으로는GoogleWorkspace계정과의호환성문제가있으며,플랫폼의FAQ는사용자가개인Gmail주소로전환할것을권장합니다.또한플랫폼은더포괄적인VisualStudioCode마켓플레이스가아닌OpenVSX확장레지스트리에의존합니다.​어려운출시에도불구하고,Google은Antigravity를개발자가코드를직접작성하기보다AI에이전트를조율하는설계자로서작동하는"에이전트우선소프트웨어개발"의미래상으로포지셔닝하고있습니다.회사는Team및Enterprise가격책정등급이곧출시될것이라고밝혔지만,에이전트워크플로우의컴퓨팅집약적특성을고려할때현재무료등급의지속가능성은여전히불확실합니다.
10 조회
0 추천
11.20 등록
(퍼플렉시티가정리한기사)YannLeCun은수요일에12년이상근무한를연말에떠나자신의인공지능스타트업을설립할것이라고발표했으며,이는소셜미디어거대기업의AI운영내지속적인격변속에서이분야의가장영향력있는선구자중한명의퇴사를의미한다.​65세의LeCun은LinkedIn게시물에서자신의새로운회사가AdvancedMachineIntelligence연구에집중할것이며,"물리적세계를이해하고,지속적인기억을가지며,추론할수있고,복잡한행동순서를계획할수있는"AI시스템을개발할것이라고밝혔다.Meta는이새로운벤처와파트너십을맺을예정이지만,협력의세부사항은아직불분명하다.​메타AI의불안정성시대이번퇴사는메타의AI부문이격동의시기를겪고있는가운데발생했습니다.10월에회사는슈퍼인텔리전스랩스에서약600개의직책을삭감했으며,이는LeCun이설립을도운기초AI연구부서에영향을미쳤습니다.이번주초,널리채택된PyTorch프레임워크의창시자인SoumithChintala가MiraMurati의스타트업에합류하기위해떠났습니다.​메타는올해ScaleAI의전CEO였던28세의AlexandrWang하에AI운영을극적으로재편했으며,그는메타가그의회사에143억달러를투자한후합류했습니다.재편성은훈련,연구,제품및인프라에집중하는네개의별개팀을만들었으며,회사의Llama4모델출시는내부적으로나외부적으로미온적인반응을얻었습니다.​갈라지는비전LeCun의Meta방향성과의철학적분열은최근몇달동안깊어졌습니다.Meta가OpenAI와Google과경쟁하기위해대규모언어모델에막대한투자를한반면,LeCun은그러한접근방식을"막다른길"이라고공개적으로비판하며,텍스트만으로훈련된AI는인간수준의지능을달성할수없다고주장했습니다.그의새로운스타트업은세계모델—물리적현실을이해하기위해비디오와공간데이터로부터학습하는AI시스템—을추구할것입니다.​LeCun은2013년Facebook에FAIR의창립이사로합류했으며,2018년이사직에서물러났지만수석AI과학자로는남아있습니다.그는딥러닝분야의혁신적업적으로GeoffreyHinton및YoshuaBengio와함께2019년튜링상을수상했습니다.그는뉴욕대학교에서시간제로계속강의할예정입니다.
9 조회
0 추천
11.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입