Loading...

AI 뉴스

Nebius, AI 분야에서 Microsoft와 경쟁하기 위해 Token Factory 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.06 00:25
1,185 조회
0 추천
0 비추천

본문

f8ef0f741350ae3a0a998ee65e4fe88a_1762356305_6729.jpg
 

(퍼플렉시티가 정리한 기사)


Nebius는 화요일에 Token Factory 플랫폼을 공개하며, 급성장하는 인공지능 추론 시장에서 Microsoft 및 기타 거대 기술 기업들과 직접 경쟁할 수 있는 위치에 AI 클라우드 제공업체를 자리매김했습니다.​

암스테르담에 본사를 둔 이 회사의 새로운 프로덕션 추론 플랫폼은 기업들이 오픈소스 AI 모델을 엔터프라이즈 규모로 배포하고 최적화할 수 있도록 지원하며, NVIDIA Nemotron, DeepSeek, OpenAI의 GPT-OSS, Meta의 Llama, 그리고 Qwen을 포함한 주요 모델들을 지원합니다. Nebius의 AI Cloud 3.0 "Aether" 인프라를 기반으로 구축된 Token Factory는 분당 수억 건의 요청을 초과하는 워크로드에 대해 1초 미만의 지연 시간, 자동 확장 처리량, 그리고 99.9%의 가동 시간을 제공합니다.​


얼리 어답터들이 상당한 비용 절감 효과를 보고하다

초기 고객들은 이미 플랫폼을 통해 상당한 경제적 이익을 얻고 있습니다. 주요 라이프스타일 및 전자상거래 브랜드를 운영하는 Prosus는 독점 모델과 비교하여 최대 26배의 비용 절감을 달성했습니다. 이 회사는 현재 Token Factory의 전용 엔드포인트와 자동 확장 기능을 사용하여 매일 최대 2,000억 개의 토큰을 처리하고 있습니다.​

Prosus의 AI 이사인 Zülküf Genç는 "Nebius Token Factory의 유연성, 제품 및 신속한 응답 덕분에 프로덕션 전 과정에서 이러한 속도를 유지할 수 있었습니다"라고 말했습니다. "자동 확장 기능의 추가는 게임 체인저였으며, 수동 개입 없이 대규모 워크로드를 처리할 수 있게 해주었습니다."​

선도적인 비디오 플랫폼인 Higgsfield AI는 온디맨드 및 자동 확장 추론 기능에 대해 Nebius를 "우리의 요구 사항을 충족하는 유일한 제공업체"라고 언급했습니다. 한편, Hugging Face는 대규모 오픈 소스 모델을 기반으로 구축하는 개발자들의 접근성을 개선하기 위해 Nebius와 협력하고 있습니다.​


기술 거대 기업에 대한 경쟁적 포지셔닝

이 출시는 Nebius가 AI 추론 분야에서 Microsoft Azure와 Amazon Web Services와 같은 기존 클라우드 제공업체로부터 시장 점유율을 확보하려는 가운데 이루어졌습니다. Token Factory는 오픈 소스 모델에 중점을 둠으로써, OpenAI 기술과의 긴밀한 통합에 집중하는 Microsoft와는 대조적인 전략을 취하고 있으며, 독점 AI 솔루션에 대한 대안을 모색하는 기업들에게 매력적으로 다가갈 수 있습니다.​

“Nebius의 공동 창업자이자 최고 비즈니스 책임자인 Roman Chernin은 ‘각 팀마다 고유한 요구사항이 있으며, 무거운 작업 없이도 속도, 신뢰성, 비용 효율성을 원한다’고 말했습니다. 이 플랫폼은 유럽 연합 또는 미국 데이터 센터에서의 제로 보존 추론, SOC 2 Type II 보안 인증, 종합적인 거버넌스 도구 등 엔터프라이즈급 기능을 포함하고 있습니다.​

제품 출시에도 불구하고 Nebius의 주가는 최근 변동성을 보였으며, 11월 1일 7.9% 하락해 120.47달러로 마감했지만, 지난 1년 동안 481%라는 눈에 띄는 상승세를 유지하고 있습니다. 회사는 11월 11일 3분기 실적을 발표할 예정이며, 투자자들은 174억 달러 규모의 Microsoft 용량 계약 진행 상황을 예의주시하고 있습니다.

댓글 0
전체 1,366 / 178 페이지
(퍼플렉시티가 정리한 기사)Google은 마샤 블랙번(Marsha Blackburn) 상원의원이 자사 시스템이 그녀에 대한 성폭행 혐의를 조작했다고 비난한 후, Gemma 인공지능 모델의 공개 접근을 중단했습니다. 이는 공인을 대상으로 한 AI 생성 허위 정보에 대한 우려가 커지고 있음을 보여줍니다.테네시주 공화당 의원인 블랙번은 목요일 구글 CEO 순다르 피차이(Sundar Pichai)에게 서한을 보내 답변을 요구했습니다. Gemma가 그녀의 1987년 주 상원 선거 운동 중 주 경찰관과 비합의적 성관계를 가졌다는 혐의를 받았다고 허위로 주장한 후였습니다. AI는 심지어 이 허위 서사를 뒷받침하기 위해 조작된 뉴스 기사에 대한 가짜 링크까지 생성했습니다. 그러나 블랙번은 실제로 1998년까지 공직에 출마하지 않았으며, 그러한 혐의는 전혀 제기된 적이 없습니다.명예훼손 주장 속에서 기술 대기업이 접근을 제한하다구글은 금요일 Gemma를 AI Studio 플랫폼에서 제거하고, 해당 모델의 접근 범위를 개발자 전용 API로 제한한다고 발표했다. 회사는 “Gemma가 소프트웨어 개발자 전용으로 설계되었음에도 불구하고, 비개발자들이 AI Studio에서 Gemma를 사용하여 사실 질문을 시도하는 사례가 보고되었다”고 밝혔다.블랙번은 AI가 생성한 거짓 정보를 뜻하는 기술 업계 용어인 ‘환각(hallucination)’에 대해 언급하며, 피차이에게 “이것은 무해한 ‘환각’이 아니다”라고 썼다. “이는 구글이 소유한 AI 모델이 만들어내고 유포한 명예훼손 행위”라고도 했다. 그녀는 11월 6일까지 시스템이 어떻게 허위 사실을 생성했는지와, 향후 유사한 사고를 방지하기 위해 구글이 취할 조치에 대해 구체적인 답변을 요구했다.이번 논란은 보수 활동가 로비 스타벅이 구글을 상대로 유사한 소송을 제기한 데서 비롯된 것이다. 그는 구글의 AI 시스템이 자신을 “아동 강간범” 및 “상습 성범죄자”로 잘못 표기했다고 주장하며 1,500만 달러 이상의 손해배상을 청구하고 있다. 스타벅의 사례는 2023년 이후 구글의 Bard, Gemini, Gemma 모델이 수백만 사용자에게 허위 정보를 전파한 데에 관련되어 있다.산업 전반의 AI 정확도 과제이 사건들은 기술 업계 전반에 걸쳐 AI “환각” 현상의 지속적인 문제를 부각시키고 있으며, 대규模 언어 모델이 거짓 정보를 사실인 것처럼 자신 있게 제시하는 현상을 보여줍니다. 구글은 “환각 현상은 AI 업계 전반의 과제이며, 특히 Gemma와 같은 소규모 오픈 모델에서 더욱 그러하다”고 인정했습니다.법률 전문가들은 AI 명예훼손 사건의 새로운 패턴이 법원과 기술 기업들에게 새로운 도전 과제를 제기한다고 지적합니다. 유사한 사건들은 전 세계적으로 공인들에게 영향을 미쳤으며, 여기에는 마이크로소프트의 AI 도구가 자신을 유죄 판결을 받은 아동 성범죄자로 잘못 묘사한 것을 발견한 독일 언론인의 사례도 포함됩니다.구글은 Gemma가 소비자용 챗봇이 아닌 애플리케이션 구축을 위한 개발자 도구로 의도되었다고 밝히며 자사의 입장을 옹호했습니다. 회사는 AI 환각 현상을 줄이기 위한 노력을 강조하는 한편, 의도적인 사용자들이 AI 시스템을 조작하여 오해의 소지가 있는 콘텐츠를 생성할 수 있다는 점을 유지했습니다.
1288 조회
0 추천
2025.11.04 등록
(퍼플렉시티가 정리한 기사)SK하이닉스가 인공지능(AI) 시대를 맞아 단순한 메모리 공급자를 넘어 고객 맞춤형 솔루션을 제공하는 ‘풀스택 AI 메모리 크리에이터’로의 전환을 선언했다. 이는 폭발적으로 증가하는 AI 메모리 수요에 대응하고, 메모리 반도체 업계의 경쟁 패러다임이 가격에서 솔루션 중심으로 변화하는 가운데 나온 전략적 전환이다.곽노정 SK하이닉스 대표는 3일 서울 코엑스에서 열린 ‘SK AI 서밋 2025’에서 “AI 시대 메모리의 중요성이 더욱 커지면서 단순한 제조 업체가 아닌 고객과 미래를 함께 설계하는 크리에이터로 거듭날 것”이라고 밝혔다.2030년까지 차세대 HBM 로드맵 공개SK하이닉스는 이번 서밋에서 2030년까지의 구체적인 차세대 고대역폭메모리(HBM) 로드맵을 처음 공개했다. 2026년부터 HBM4 16단과 HBM4E 8·12·16단, 커스텀 HBM4E를 순차 출시하고, 2029년부터 2031년 사이에는 HBM5와 HBM5E를 선보일 예정이다.특히 주목받는 것은 커스텀 HBM 기술이다. 이는 고객의 요청사항을 반영해 그래픽처리장치(GPU)나 주문형반도체(ASIC)의 일부 기능을 HBM 베이스 다이로 옮겨 성능을 극대화하고 전력 소모를 줄이는 맞춤형 솔루션이다.박경 SK하이닉스 부사장은 “2030년에 웨이퍼 기준으로 D램이 4100만장 필요하지만 실제 공급 가능한 물량은 3000만장에 불과하다”며 “메모리 비즈니스가 과거 범용 위주를 넘어 관계가 중요한 힘을 가진 방향으로 재편될 것”이라고 전망했다.글로벌 AI 기업들과 전방위 협력 강화SK하이닉스는 AI 메모리 크리에이터로서의 역할을 강화하기 위해 글로벌 주요 기업들과의 협력을 확대하고 있다. 엔비디아와는 HBM 협력뿐 아니라 옴니버스, 디지털 트윈을 활용한 AI 제조 혁신을 추진하고 있으며, 오픈AI와는 고성능 메모리 공급을 위한 장기 협력을 모색 중이다.또한 TSMC와는 차세대 HBM 베이스 다이 개발 협력을, 샌디스크와는 차세대 낸드 기술인 고대역폭플래시(HBF) 국제 표준화를 공동 추진하고 있다. 네이버클라우드와는 AI 데이터센터 효율화를 위한 차세대 메모리와 소프트웨어 최적화 협력도 진행 중이다.한편 SK하이닉스는 이날 한국거래소로부터 투자주의종목으로 지정됐다. 최근 1년간 주가가 200% 이상 상승하고 특정 계좌의 매수 관여율이 기준을 초과했기 때문이다. 3일 SK하이닉스 주가는 10.9% 급등한 62만원대로 마감했으며, 올해 들어 상승률만 257%에 달한다.
1244 조회
0 추천
2025.11.04 등록
(퍼플렉시티가정리한기사)LG전자가글로벌데이터센터인프라기업플렉스(Flex)와손잡고인공지능(AI)데이터센터의발열문제를해결할모듈형냉각솔루션개발에나선다고4일발표했다.​양사는최근업무협약(MOU)을체결하고LG전자의칠러(초대형냉방기),냉각수분배장치(CDU),컴퓨터룸공기처리장치(CRAH)등고효율냉각제품과플렉스의IT·전력인프라를결합한모듈형데이터센터냉각솔루션을공동개발할계획이다.​확장성과유연성극대화한모듈기반구조새로개발될모듈형냉각솔루션은데이터센터인프라의확장성과유연성을극대화하기위해모듈기반구조로설계된다.사전조립과테스트를마친냉각모듈형태로제작돼현장에서다른모듈들과결합되는방식으로,필요에따라냉각모듈을쉽게추가할수있어데이터센터인프라확장에유리하다.​또한데이터센터의열관리요구사항에맞춰맞춤형으로구성할수있고빠른배포와설치가가능해기존냉각솔루션과차별화된다.양사는이번협업을통해데이터센터구축과정을간소화하고고객들에게혁신적인확장형데이터센터인프라를제공할수있을것으로기대하고있다.​급성장하는AI데이터센터냉각시장선점이번협업은AI데이터센터시장의급속한성장과맞물려주목받고있다.글로벌데이터센터냉각시장규모는2025년177억달러에서2035년629억달러로연평균13.5%성장할것으로전망된다.특히AI수요증가로데이터센터의전력소모와발열이기하급수적으로늘어나면서효율적인냉각기술의중요성이급격히커지고있다.​플렉스는전자제품위탁생산(EMS)분야를선도하는글로벌기업으로,데이터센터를비롯해자동차,헬스케어,통신등다양한산업에설계·개발·제조·공급망관리·사후서비스를아우르는종합솔루션을제공한다.올해타임지가선정한'세계최고기업2025'에도이름을올렸다.​마이클하퉁플렉스사장겸최고상업책임자는"LG전자와협력해데이터센터의열문제를해결하는최적의냉각솔루션을고객들에게제공할것"이라고말했다.이재성LG전자ES사업본부장부사장은"플렉스와의협업은단순한파트너십을넘어고객에게혁신적이고차별화된가치를제공하는동시에,AI데이터센터시장에서LG전자의입지를강화하는전략적기회가될것"이라고강조했다.
1156 조회
0 추천
2025.11.04 등록
(퍼플렉시티가정리한기사)마이크로소프트가UAE와호주등에총33조원규모의대규모AI인프라투자를단행하며글로벌인공지능시장확장에박차를가하고있다.이번투자는AI컴퓨팅자원부족을해결하고'네오클라우드'시장에서의경쟁력을강화하려는전략으로분석된다.트럼프행정부첫GPU수출허가로UAE투자탄력브래드스미스마이크로소프트사장은3일(현지시간)UAE에2029년까지총152억달러(약21조8000억원)를투자하겠다고발표했다.이는2023년부터현재까지투자한73억달러에추가로79억달러를더투입하는것이다.​특히마이크로소프트는지난9월트럼프행정부들어처음으로AI연산용그래픽처리장치(GPU)를UAE에수출할수있는허가를획득했다.이번허가로엔비디아A100칩6만400개상당의GPU와최신GB300GPU까지수출할수있게됐다.​UAE의AI이용률이59.4%로세계1위를기록하고있어AI빅테크들의투자가집중되고있다.마이크로소프트는이미UAE국영AI기업G42에15억달러를지분투자했으며,AI·클라우드인프라에46억달러를지출했다.​호주IREN과14조원계약으로네오클라우드시장진출마이크로소프트는같은날호주AI인프라기업아이렌(IREN)과5년간97억달러(약14조원)규모의클라우드서비스계약을체결했다고발표했다.이번계약으로마이크로소프트는아이렌의최대고객이됐다.​아이렌은엔비디아의최신GB300아키텍처GPU를적용한클라우드서비스를제공하며,관련장비를델에서58억달러에구매해텍사스주데이터센터에배치할예정이다.계약발표직후아이렌주가는24.7%급등했다.​아이렌은원래비트코인채굴업체에서AI인프라기업으로전환한대표적인'네오클라우드'기업이다.네오클라우드는범용클라우드와달리AI연산에특화된고성능컴퓨팅환경을제공하는차세대클라우드서비스를의미한다.​AI컴퓨팅자원확보전쟁본격화마이크로소프트의연이은대형계약은AI시장급성장속에서컴퓨팅자원부족문제를선제적으로해결하려는전략으로해석된다.기존데이터센터구축보다전문업체와의장기계약을통해AI서버용량을확보하는것이더효율적이기때문이다.​마이크로소프트는이번계약외에도AI클라우드스타트업람다(Lambda)와수십억달러규모의엔비디아GPU사용계약을체결했으며,지난9월에는네비우스와5년간174억달러규모의인프라구매계약을맺은바있다.​업계전문가들은이러한움직임을단순한서버임대가아닌'AI연산자원의장기적선점전략'으로평가하고있다.AI학습과서비스운영에필요한막대한GPU자원을미리확보해향후AI시장에서의경쟁우위를확보하려는것으로분석된다.
1152 조회
0 추천
2025.11.04 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입