Loading...

AI 뉴스

AWS, 엔비디아 블랙웰 울트라 GPU를 탑재한 AI 인스턴스 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.20 03:00
858 조회
0 추천
0 비추천

본문

inference-corp-blog-onsite-gtcdc-think-smart-blog-1280x680-4529232.png

(퍼플렉시티가 정리한 기사)


Amazon Web Services는 월요일 Nvidia의 Blackwell Ultra GPU를 탑재한 Amazon EC2 P6-B300 인스턴스의 정식 출시를 발표했으며, 이는 고성능 AI 인프라에 대한 급증하는 수요를 충족시키기 위한 클라우드 거대 기업의 최신 노력을 보여줍니다.​

새로운 인스턴스는 올해 초 출시된 AWS의 이전 세대 P6-B200 인스턴스와 비교하여 2배의 네트워킹 대역폭과 1.5배 더 많은 GPU 메모리를 제공합니다. 각 P6-B300 인스턴스는 2.1테라바이트의 고대역폭 GPU 메모리, 초당 6.4테라비트의 Elastic Fabric Adapter 네트워킹, 그리고 4테라바이트의 시스템 메모리를 갖춘 8개의 Nvidia B300 GPU를 탑재하고 있습니다.​


조 단위 매개변수 모델을 위해 설계됨

AWS에 따르면, 이 인스턴스들은 Mixture of Experts 및 멀티모달 처리와 같은 정교한 기술을 사용하는 대규모 AI 모델, 특히 수천 개의 GPU에 걸친 분산 훈련이 필요한 수조 개의 매개변수를 가진 모델을 훈련하고 배포하도록 설계되었습니다. 향상된 메모리 및 네트워킹 기능을 통해 대규모 모델이 단일 Nvidia NVLink 도메인 내에 상주할 수 있어 모델 샤딩 및 통신 오버헤드가 감소합니다.​

P6-B300 인스턴스는 FSx for Lustre와 함께 Nvidia GPUDirect Storage를 지원하여 빠른 모델 로딩을 위해 초당 최대 1.2테라비트의 처리량을 달성합니다. 이 인스턴스들은 현재 Amazon EC2 Capacity Blocks for ML 및 Savings Plans를 통해 미국 서부(오리건) 리전에서 사용할 수 있습니다.​


AI 인프라 포트폴리오 확장

이번 출시로 AWS는 경쟁사인 Microsoft와 Google과 경쟁할 수 있는 위치에 서게 되었으며, 이들 역시 Blackwell 기반 인프라를 출시한 바 있습니다. Microsoft는 11월 초 4,600개 이상의 Nvidia Blackwell Ultra GPU를 탑재한 Nvidia GB300 NVL72 시스템의 첫 번째 대규모 프로덕션 클러스터를 배포한다고 발표했습니다. Google Cloud는 10월에 Nvidia의 RTX PRO 6000 Blackwell Server Edition GPU를 탑재한 G4 가상 머신을 정식 출시했습니다.​

AWS는 12월 1일부터 5일까지 라스베이거스에서 열리는 re:Invent 컨퍼런스에서 추가적인 컨테이너 및 AI 개발 사항을 선보일 예정입니다.

댓글 0
전체 1,366 / 140 페이지
(퍼플렉시티가정리한기사)AntInternational은전세계기업을위한시계열예측을혁신하도록설계된오픈소스인공지능모델인FalconTST를공개했습니다.2025년싱가포르핀테크페스티벌에서발표된이모델은현재GitHub와HuggingFace에서전세계개발자및연구기관이이용할수있습니다.​싱가포르에본사를둔이핀테크회사는FalconTST를여러패치토크나이저를갖춘업계최초의MixtureofExperts아키텍처기반시계열예측모델로설명하며,최대25억개의매개변수를지원합니다.AntInternationalCEOYangPeng에따르면,이모델은현재회사글로벌거래의약60%를처리하고있으며,2025년첫10개월동안거래액은1.5조달러에달해2024년대비36%증가했습니다.​통화관리에서입증된결과FalconTST는2024년부터AntInternational에내부적으로배포되어시간별,일별,주별현금흐름및외환익스포저예측에서90%를초과하는정확도를달성했습니다.이모델은여러출처에따르면회사의외환비용을최대60%까지절감하는데기여했습니다.​AntInternational의최고혁신책임자인Jiang-MingYang은"검증된FalconTST모델을오픈소스화함으로써전세계과학자들이실제피드백을제공하고시계열학습의혁신을가속화하도록초대하여글로벌협업을통해이분야를발전시키는것을목표로합니다"라고말했습니다.​이모델은이미여러부문의산업파트너들과함께배포되었습니다.2025년7월,Citi와AntInternational은아시아의한항공사와함께FalconTST모델을시범운영하여초기실제거래에서외환헤지비용을30%절감했습니다.별도로CapitalA는AirAsia를위해이모델을활용하여90%의예측정확도를달성하면서외환헤지비용을최대40%까지절감했습니다.​산업전반에걸친광범위한응용재무예측을넘어,FalconTST는기업들이날씨패턴,달력이벤트,금융시장변동,국경간교통량을포함한다양한시계열데이터를예측할수있도록지원합니다.국제공항협의회(AirportsCouncilInternationalWorld)가2025년전세계항공여행객이98억명에달할것으로전망하는가운데,항공사자금관리분야에서이모델의활용은전세계소비자들의비용절감으로이어질수있습니다.​이회사는또한Shield라는두번째AI기초모델을개발했습니다.이는80억개의매개변수를가진결제위험통제모델로,매일2,200만건의거래를보호하며사기를13.5%감소시킵니다.
1211 조회
0 추천
2025.11.12 등록
(퍼플렉시티가정리한기사)바이두는11월11일ERNIE-4.5-VL-28B-A3B-Thinking을공개했다.이는오픈소스멀티모달AI모델로,중국기술대기업은이모델이여러벤치마크에서OpenAI의GPT-5와구글의Gemini2.5Pro를능가한다고주장한다.이번출시는중국과서구기술기업간격화되는인공지능경쟁에서중요한확대를의미한다.​허용적인Apache2.0라이선스로공개된이모델은총280억개의파라미터를가진전문가혼합(Mixture-of-Experts)아키텍처를사용하지만,추론당30억개만활성화하여높은성능을유지하면서도계산비용을획기적으로줄인다.바이두의발표에따르면,이모델은문서및차트이해분야의VQA,MMBench,SEED-Bench평가에서Gemini2.5Pro를능가한다.​효율성과성능의만남경량설계를통해ERNIE-4.5-VL은비슷한수준의전체매개변수모델보다2~3배빠른추론속도를제공하면서도훨씬적은메모리를요구합니다.이모델은이미지의특정영역을확대하고,잘라낸뷰를분석하며,국소적관찰을종합적인답변으로통합할수있는혁신적인"이미지를통한사고(ThinkingwithImages)"기능을도입했습니다.​바이두연구진은동적난이도샘플링을적용한GSPO및IcePop을포함한고급강화학습전략을활용하여대규모시각-언어추론데이터에대한광범위한중간학습단계를통해이모델을훈련했습니다.이모델은시각적추론,STEM문제해결,시각적그라운딩,도구활용및비디오이해분야에서뛰어난성능을발휘합니다.​전략적오픈소스추진이번출시는중국이미국기업들과경쟁하기위해오픈소스AI전략을강화하는가운데이루어졌습니다.최근분석에따르면,중국은오픈소스AI다운로드에서미국을앞질렀으며,DeepSeek,Alibaba,Baidu같은기업들이서구경쟁사들보다더빠르고저렴하게고성능모델을생산할수있음을입증하고있습니다.​남가주대학교(UniversityofSouthernCalifornia)의SeanRen은CNBC에"주요연구소가강력한모델을오픈소스로공개할때마다업계전체의기준이높아진다"고말했습니다.이러한움직임은독점API와프리미엄가격에의존하는OpenAI와Anthropic같은비공개소스제공업체들에압박을가하고있습니다.​Baidu는11월13일베이징에서열리는BaiduWorld2025컨퍼런스에서ERNIE라인업과추가AI발전사항을선보일예정입니다.이는중국의경쟁적인AI환경에서선두주자로서의입지를굳히기위한노력의일환입니다.
1282 조회
0 추천
2025.11.12 등록
(퍼플렉시티가정리한기사)막스플랑크기상연구소의연구자들은기후과학자들이그들의분야에서"성배"라고부르는것을달성했습니다:기상예보와기후모델링을완벽하게결합한1.25킬로미터해상도의지구디지털트윈입니다.​11월3일arXiv에제출된논문에자세히설명된이획기적인성과는거의킬로미터규모에서전체지구시스템의최초전지구시뮬레이션을나타내며,대기,해양,육지를통한에너지,물,탄소의흐름을포착합니다.DanielKlocke가이끄는팀은6억7천2백만개의셀을모델링했습니다—지구의육지와해양표면을덮는3억3천6백만개의셀과그위에쌓인동일한수의대기셀입니다.​전례없는컴퓨팅파워이시뮬레이션은유럽에서가장강력한두슈퍼컴퓨터에걸쳐방대한컴퓨팅리소스를필요로했습니다:스위스의Alps시스템에서8,192개의GPU와독일의JUPITER에서20,480개의GPU를사용했습니다.두시스템모두Nvidia의새로운GH200GraceHopper슈퍼칩을활용하며,이는GPU와CPU기능을결합하여모델의다양한측면을처리합니다.​연구팀은하루당145.7일의시뮬레이션을수행하는시간압축을달성했으며,거의1조개의자유도(모델이계산해야하는값의총개수)를사용했습니다.이러한성능은유사한해상도의이전대기전용시뮬레이션을능가하며,지구시스템상호작용에대한장기연구를가능하게합니다.​해상도장벽돌파하기진정한혁신은이해상도에서"빠른"지구시스템프로세스와"느린"지구시스템프로세스를결합하는데있습니다.빠른시스템에는날씨를지배하는에너지및물순환이포함되며,폭풍이개별격자셀을가로질러이동함에따라몇분마다업데이트됩니다.느린프로세스에는탄소순환,생물권변화,그리고수년또는수십년에걸쳐진화하는해양지구화학이포함됩니다.​UniverseToday에따르면,이러한복잡한시스템을통합하는일반적인모델은40킬로미터를초과하는해상도에서만계산적으로처리가능했습니다.돌파구는수십년된Fortran코드베이스를현대화한Data-CentricParallelProgramming프레임워크를사용한정교한소프트웨어엔지니어링을통해이루어졌습니다.​이연구로팀은11월18일슈퍼컴퓨팅컨퍼런스에서발표될예정인권위있는GordonBellPrizeforClimateModelling후보로지명되었습니다.
1171 조회
0 추천
2025.11.12 등록
(퍼플렉시티가정리한기사)대만의전자제품대기업폭스콘은수요일3분기실적발표에서인공지능수요에대한낙관적인전망을시사하며,다음주OpenAI협력에대한세부사항을공개할계획을밝혔고AI가2026년가장중요한성장동력이될것으로전망했다.세계최대전자제품위탁제조업체는7-9월기간동안순이익576억7천만대만달러(18억9천만달러)를기록했으며,이는전년대비17%증가한수치로애널리스트예상치인504억대만달러를상회했다.매출은11%증가한2조6백억대만달러를기록했으며,이는클라우드제공업체들이데이터센터인프라에수십억달러를쏟아붓는가운데AI서버에대한수요가급증한데따른것이다.​AI서버가아이폰을제치고매출선두로부상AI서버생산을포함하는폭스콘의클라우드및네트워킹부문은현재전체매출의42%를차지하며,AppleiPhone조립을포함하는스마트소비자전자제품부문을2분기연속앞지르고있습니다.이는소비자전자제품이폭스콘매출의54%를차지했던2021년과비교하면극적인변화를나타냅니다.​류영웨이(YoungLiu)회장은실적발표에서투자자들에게"2026년에는AI산업의발전이가장중요한성장동력이될것으로보고있습니다"라고말했습니다.그는"2026년에대해매우낙관적입니다"라고덧붙이면서도,회사가지정학적불확실성과외환변동성을모니터링할것이라고언급했습니다.​실적보고서에서폭스콘은4분기에전년대비상당한매출성장을전망했으며,AI서버매출은전분기대비증가할것으로예상했습니다.Nvidia의최대서버제조업체인이회사는Microsoft,Amazon,Alphabet의Google을포함한거대기술기업들의AI인프라에대한전례없는투자로이익을얻고있습니다.​OpenAI파트너십세부사항다음주공개예정Liu는Foxconn이다음주타이페이에서연례기술의날행사를개최할예정이며,이자리에서OpenAI와의협력에대한세부사항을발표할계획이라고밝혔다.OpenAICEOSamAltman은10월에대만을방문하여Foxconn및TaiwanSemiconductorManufacturingCompany와만나회사의Stargate프로젝트를위한AI서버인프라및칩생산에대해논의했다.​이번예고된발표는Foxconn이2002년그래픽카드용레퍼런스디자인제작을시작한이래이어온Nvidia와의기존관계를넘어AI파트너십을심화하고있음을시사한다.Foxconn은현재범용서버와AI서버모두에서전세계시장점유율약40%를차지하고있다고주장한다.
1184 조회
0 추천
2025.11.12 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입