Loading...

AI 뉴스

AWS, 엔비디아 블랙웰 울트라 GPU를 탑재한 AI 인스턴스 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.20 03:00
670 조회
0 추천
0 비추천

본문

inference-corp-blog-onsite-gtcdc-think-smart-blog-1280x680-4529232.png

(퍼플렉시티가 정리한 기사)


Amazon Web Services는 월요일 Nvidia의 Blackwell Ultra GPU를 탑재한 Amazon EC2 P6-B300 인스턴스의 정식 출시를 발표했으며, 이는 고성능 AI 인프라에 대한 급증하는 수요를 충족시키기 위한 클라우드 거대 기업의 최신 노력을 보여줍니다.​

새로운 인스턴스는 올해 초 출시된 AWS의 이전 세대 P6-B200 인스턴스와 비교하여 2배의 네트워킹 대역폭과 1.5배 더 많은 GPU 메모리를 제공합니다. 각 P6-B300 인스턴스는 2.1테라바이트의 고대역폭 GPU 메모리, 초당 6.4테라비트의 Elastic Fabric Adapter 네트워킹, 그리고 4테라바이트의 시스템 메모리를 갖춘 8개의 Nvidia B300 GPU를 탑재하고 있습니다.​


조 단위 매개변수 모델을 위해 설계됨

AWS에 따르면, 이 인스턴스들은 Mixture of Experts 및 멀티모달 처리와 같은 정교한 기술을 사용하는 대규모 AI 모델, 특히 수천 개의 GPU에 걸친 분산 훈련이 필요한 수조 개의 매개변수를 가진 모델을 훈련하고 배포하도록 설계되었습니다. 향상된 메모리 및 네트워킹 기능을 통해 대규모 모델이 단일 Nvidia NVLink 도메인 내에 상주할 수 있어 모델 샤딩 및 통신 오버헤드가 감소합니다.​

P6-B300 인스턴스는 FSx for Lustre와 함께 Nvidia GPUDirect Storage를 지원하여 빠른 모델 로딩을 위해 초당 최대 1.2테라비트의 처리량을 달성합니다. 이 인스턴스들은 현재 Amazon EC2 Capacity Blocks for ML 및 Savings Plans를 통해 미국 서부(오리건) 리전에서 사용할 수 있습니다.​


AI 인프라 포트폴리오 확장

이번 출시로 AWS는 경쟁사인 Microsoft와 Google과 경쟁할 수 있는 위치에 서게 되었으며, 이들 역시 Blackwell 기반 인프라를 출시한 바 있습니다. Microsoft는 11월 초 4,600개 이상의 Nvidia Blackwell Ultra GPU를 탑재한 Nvidia GB300 NVL72 시스템의 첫 번째 대규모 프로덕션 클러스터를 배포한다고 발표했습니다. Google Cloud는 10월에 Nvidia의 RTX PRO 6000 Blackwell Server Edition GPU를 탑재한 G4 가상 머신을 정식 출시했습니다.​

AWS는 12월 1일부터 5일까지 라스베이거스에서 열리는 re:Invent 컨퍼런스에서 추가적인 컨테이너 및 AI 개발 사항을 선보일 예정입니다.

댓글 0
전체 1,366 / 63 페이지
VentureBeat기사는스스로를"AI우선"이라고선언하는대부분의기업들이진정한도입보다는형식적인혁신에몰두하고있다고주장하며,진정한AI도입은하향식기업지시가아닌호기심많은직원들이조용히실험하는과정에서자연스럽게나타난다고설명합니다.​이기사는직접프로토타입을만들고자신의실패를공유하는리더와금요일까지AI계획을요구하는Slack메시지로단순히규정준수를강요하는리더를구분하며,전자는실질적인추진력을조성하는반면후자는반감을낳는다고설명합니다.​기사는재무및운영부서의직원들이일반적으로이사회프레젠테이션에등장하는고가의엔터프라이즈플랫폼이아닌"그냥ChatGPT"를사용한다고인정한다고언급하며,최근설문조사에따르면광범위한도입의무에도불구하고직원의5%만이AI를최대한활용하여업무를혁신하고있다고밝힙니다.
637 조회
0 추천
2025.11.25 등록
Microsoft는사용자의PC에서직접시각적스크린샷을해석하고마우스및키보드동작을제어하여작업을수행하는70억개의매개변수를가진AI에이전트Fara-7B를공개했으며,이는데이터처리를로컬에유지하여개인정보보호를강화하고HIPAA및GLBA와같은규정을준수할수있는클라우드기반모델의대안을제공합니다.​WebVoyager웹탐색벤치마크에서Fara-7B는69.5%의작업성공률을달성하여GPT-4o의65.1%성능을능가했으며,유사한크기의모델이필요로하는41단계에비해약16단계만에작업을완료했습니다.​이모델은Microsoft의Magentic-One다중에이전트프레임워크에의해생성된145,000개의합성작업궤적을사용하여훈련되었으며,현재MIT라이선스하에HuggingFace에서사용할수있습니다.다만Microsoft는이모델이여전히실험적이며프로덕션배포보다는파일럿프로젝트에가장적합하다고주의를당부하고있습니다.
620 조회
0 추천
2025.11.25 등록
TheAIGRID비디오는TheInformation의보도를바탕으로OpenAICEOSamAltman이Google의부활한Gemini3모델이경쟁력을확보함에따라"험난한분위기"와일시적인경제적역풍에대해직원들에게경고한내부메모를분석합니다.​Anthropic은더늦게출시했음에도불구하고2025년동안API수익에서OpenAI를추월할것으로예상되며,OpenAI의생성형AI트래픽점유율은지난1년간Google이5.6%에서13.7%로상승하면서하락했습니다.​​SalesforceCEOMarcBenioff는3년간의일일사용끝에ChatGPT를포기하고Gemini3로전환한다고발표하며이를"놀라운"도약이라고평가했으며,OpenAI는2029년까지1,150억달러의현금소진이예상되는반면Google은연간700억달러의잉여현금흐름을보유하고있습니다.
622 조회
0 추천
2025.11.25 등록
OpenAI는월요일에ChatGPT의새로운쇼핑리서치기능을출시하여,무료계정부터유료구독까지모든사용자에게블랙프라이데이쇼핑러시직전에제품발견과비교를간소화하도록설계된AI기반쇼핑어시스턴트에대한액세스를제공했습니다.​이기능은OpenAI의커머스분야로의가장과감한진출을나타내며,이미수억명의소비자가제품조사를위해ChatGPT를이용하는수익성높은온라인쇼핑시장에서Amazon및Google과직접경쟁할수있는위치에회사를놓았습니다.온라인쇼핑에대한새로운접근ShoppingResearch는제품검색을대화형상호작용으로전환하여,리뷰사이트,소매업체목록,Reddit과같은커뮤니티포럼에서최신정보를검색하기전에명확한질문을던집니다.사용자는"작은아파트를위한가장조용한무선스틱청소기찾기"와같이자연어로자신의요구사항을설명할수있으며,몇분안에맞춤형구매가이드를받을수있습니다.​이도구는강화학습을사용하여쇼핑작업에특화되도록훈련된GPT-5mini의특수버전으로구동됩니다.OpenAI는이모델이사용자쿼리의모든측면과일치하는항목을정확하게식별하는비율이64%로,이전ChatGPT버전의37%에서향상되었다고주장합니다.이기능은전자제품,뷰티제품,가전제품,스포츠장비와같이세부정보가많은카테고리에서뛰어난성능을발휘합니다.​연휴쇼핑객을지원하기위해OpenAI는시즌내내모든계정유형에서거의무제한사용을제공하고있습니다.사용자는항목을"관심없음"또는"이와유사하게"로표시하여실시간으로검색을개선할수있으며,AI는그에따라추천을조정합니다.​심화되는경쟁이번출시는기술대기업들이AI기반상거래지배를두고경쟁하는가운데이루어졌습니다.지난주아마존은루퍼스(Rufus)쇼핑어시스턴트를업그레이드하여가격이력추적과목표가격에도달하면자동으로상품을구매하는기능을추가했습니다.구글또한11월중순에현지매장에전화해상품재고와가격을확인하는AI등유사한도구들을도입했습니다.​오픈AI의접근방식은단일소매업체의재고가아닌전체웹을스캔하는점에서차별화됩니다.그러나현재이기능은아마존상품목록은제외하며,사용자가아마존사이트에서직접재고를확인하도록안내합니다.오픈AI는추천이"유기적이며광고지원이아닌",특정소매업체를우대하지않는다는점을강조합니다.​현재ShoppingResearch는사용자가구매를위해외부소매업체웹사이트로연결되지만,오픈AI는이미Walmart와Target과의파트너십을맺고있어InstantCheckout기능을통해앱내에서바로결제가가능합니다.이기능은결국새로운도구와통합될예정입니다.​소비자데이터에따르면stakes는상당히높습니다.ChatGPT는이미매일약5천만건의쇼핑관련질의를처리하며,이는25억건의총일일프롬프트중약2%에해당합니다.웹분석기업Similarweb에따르면,ChatGPT는이제Walmart,Etsy,Target등주요소매업체로넘어가는레퍼럴트래픽의20%이상을유도하고있습니다.
590 조회
0 추천
2025.11.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입