Loading...

AI 뉴스

Nebius, AI 분야에서 Microsoft와 경쟁하기 위해 Token Factory 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.06 00:25
1,234 조회
0 추천
0 비추천

본문

f8ef0f741350ae3a0a998ee65e4fe88a_1762356305_6729.jpg
 

(퍼플렉시티가 정리한 기사)


Nebius는 화요일에 Token Factory 플랫폼을 공개하며, 급성장하는 인공지능 추론 시장에서 Microsoft 및 기타 거대 기술 기업들과 직접 경쟁할 수 있는 위치에 AI 클라우드 제공업체를 자리매김했습니다.​

암스테르담에 본사를 둔 이 회사의 새로운 프로덕션 추론 플랫폼은 기업들이 오픈소스 AI 모델을 엔터프라이즈 규모로 배포하고 최적화할 수 있도록 지원하며, NVIDIA Nemotron, DeepSeek, OpenAI의 GPT-OSS, Meta의 Llama, 그리고 Qwen을 포함한 주요 모델들을 지원합니다. Nebius의 AI Cloud 3.0 "Aether" 인프라를 기반으로 구축된 Token Factory는 분당 수억 건의 요청을 초과하는 워크로드에 대해 1초 미만의 지연 시간, 자동 확장 처리량, 그리고 99.9%의 가동 시간을 제공합니다.​


얼리 어답터들이 상당한 비용 절감 효과를 보고하다

초기 고객들은 이미 플랫폼을 통해 상당한 경제적 이익을 얻고 있습니다. 주요 라이프스타일 및 전자상거래 브랜드를 운영하는 Prosus는 독점 모델과 비교하여 최대 26배의 비용 절감을 달성했습니다. 이 회사는 현재 Token Factory의 전용 엔드포인트와 자동 확장 기능을 사용하여 매일 최대 2,000억 개의 토큰을 처리하고 있습니다.​

Prosus의 AI 이사인 Zülküf Genç는 "Nebius Token Factory의 유연성, 제품 및 신속한 응답 덕분에 프로덕션 전 과정에서 이러한 속도를 유지할 수 있었습니다"라고 말했습니다. "자동 확장 기능의 추가는 게임 체인저였으며, 수동 개입 없이 대규모 워크로드를 처리할 수 있게 해주었습니다."​

선도적인 비디오 플랫폼인 Higgsfield AI는 온디맨드 및 자동 확장 추론 기능에 대해 Nebius를 "우리의 요구 사항을 충족하는 유일한 제공업체"라고 언급했습니다. 한편, Hugging Face는 대규모 오픈 소스 모델을 기반으로 구축하는 개발자들의 접근성을 개선하기 위해 Nebius와 협력하고 있습니다.​


기술 거대 기업에 대한 경쟁적 포지셔닝

이 출시는 Nebius가 AI 추론 분야에서 Microsoft Azure와 Amazon Web Services와 같은 기존 클라우드 제공업체로부터 시장 점유율을 확보하려는 가운데 이루어졌습니다. Token Factory는 오픈 소스 모델에 중점을 둠으로써, OpenAI 기술과의 긴밀한 통합에 집중하는 Microsoft와는 대조적인 전략을 취하고 있으며, 독점 AI 솔루션에 대한 대안을 모색하는 기업들에게 매력적으로 다가갈 수 있습니다.​

“Nebius의 공동 창업자이자 최고 비즈니스 책임자인 Roman Chernin은 ‘각 팀마다 고유한 요구사항이 있으며, 무거운 작업 없이도 속도, 신뢰성, 비용 효율성을 원한다’고 말했습니다. 이 플랫폼은 유럽 연합 또는 미국 데이터 센터에서의 제로 보존 추론, SOC 2 Type II 보안 인증, 종합적인 거버넌스 도구 등 엔터프라이즈급 기능을 포함하고 있습니다.​

제품 출시에도 불구하고 Nebius의 주가는 최근 변동성을 보였으며, 11월 1일 7.9% 하락해 120.47달러로 마감했지만, 지난 1년 동안 481%라는 눈에 띄는 상승세를 유지하고 있습니다. 회사는 11월 11일 3분기 실적을 발표할 예정이며, 투자자들은 174억 달러 규모의 Microsoft 용량 계약 진행 상황을 예의주시하고 있습니다.

댓글 0
전체 1,366 / 135 페이지
(퍼플렉시티가정리한기사)테슬라코리아가12일공식엑스(X,옛트위터)계정을통해완전자율주행(FSD·FullSelf-Driving)감독형서비스를한국에곧출시한다고밝혔다.테슬라가한국내FSD서비스출시계획을공식적으로밝힌것은이번이처음이다.​테슬라코리아는"FSD감독형,다음목적지:한국,곧출시(ComingSoon)"라는게시물과함께서울도심에서FSD로자율주행하는영상을공개했다.영상에는운전자가핸들에서손을떼거나가볍게올려둔채로차량이스스로차선을변경하고주차하는모습이담겼다.​아시아주요시장중최초도입테슬라의FSD는현재미국,캐나다,멕시코,중국,호주,뉴질랜드에서서비스중이다.한국은중국에이어아시아주요국가로는두번째FSD도입국이될전망이다.최근일본에서도FSD시험주행이시작됐다.​감독형FSD는차량이가속,제동,핸들링등운전결정의대부분을독자적으로수행하지만,운전자는항상전방을주시하고비상상황에서개입할준비가돼있어야한다.테슬라코리아는영상에서"감독형FSD는완전한자율주행기능이아니며모든장애물,도로,교통상황을완벽히인식하지못할수있어운전자는항상주의를유지하고즉시제어할준비가되어있어야한다"고밝혔다.​정부규제와안전성논란국토교통부는지난해부터테슬라FSD도입에대해"특별히제한을두지않겠다"는입장을밝혀왔다.올해3월에는"테슬라가자기인증제도를활용해국내에서완전자율주행기능을적용할수있다"고밝히며제도적문턱을낮췄다.​한편미국도로교통안전국(NHTSA)은지난10월부터약290만대의테슬라FSD차량을대상으로신호위반,역주행등교통법규위반의혹에대한전면조사를진행중이다.테슬라측은FSD가53억마일주행중55건의위반을기록해미국평균운전자대비200배이상안전하다고주장하고있다.​테슬라코리아는FSD옵션가격을904만원으로책정했다.기존테슬라차량중FSD용'하드웨어3.0'이상을탑재한모델은소프트웨어업그레이드를통해이용할수있다.테슬라는올해1~10월국내에서4만7962대를판매해BMW,메르세데스-벤츠에이어수입차브랜드3위를차지하고있다.
1020 조회
0 추천
2025.11.13 등록
(퍼플렉시티가정리한기사)DeductiveAI는화요일750만달러의시드펀딩을받으며스텔스모드에서벗어났으며,소프트웨어엔지니어링의가장고질적인문제중하나에대한솔루션을제시했습니다.엔지니어들이새로운제품을구축하는대신버그를찾는데거의절반의시간을소비하는문제입니다.Databricks와ThoughtSpot출신의베테랑들이설립한이마운틴뷰스타트업은게임AI시스템을구동하는것과유사한강화학습기술을사용하여몇시간이아닌몇분만에프로덕션장애를진단하는AI에이전트를배포합니다.​이번펀딩라운드는CRV가주도했으며,DatabricksVentures,ThomvestVentures,PrimeSet이참여했습니다.회사는실제사고로부터학습하여장애를자동으로감지하고,근본원인을진단하며,엔지니어가소프트웨어문제를해결하도록돕는"AISRE에이전트"를도입하고있습니다.이기능은사고해결시간을최대90퍼센트까지단축할수있다고회사는밝혔습니다.​AI가더많은코드를생성하면서증가하는문제를목표로삼다이러한시기는소프트웨어개발에서증가하는긴장감을반영합니다.AI코딩어시스턴트가엔지니어들이그어느때보다빠르게코드를작성할수있도록지원하는동안,연구에따르면개발자들은시간의30~50%를디버깅에소비하며,AI생성코드가확산되면서이수치는증가하기만했습니다.Harness의2025년보고서에따르면개발자의67%가AI생성코드를디버깅하는데더많은시간을할애하고있습니다.​DeductiveAI의공동창업자이자CEO인RakeshKothari는VentureBeat와의인터뷰에서"우리는세계적수준의엔지니어들이구축하는대신시간의절반을디버깅에소비하는것을목격했습니다"라고말했습니다."그리고바이브코딩이전례없는속도로새로운코드를생성함에따라,이문제는더욱악화될것입니다."​이회사는이미여러주목할만한고객사에서실제영향력을입증했습니다.DoorDash의광고플랫폼은Deductive를사고대응프로토콜에통합했으며,DoorDash의엔지니어링수석이사인ShahroozAnsari에따르면이시스템이최근몇달동안약100건의프로덕션사고에대한근본원인을식별했으며,이는연간1,000시간이상의생산성절감과수백만달러상당의수익영향으로환산된다고합니다.위치인텔리전스기업Foursquare에서Deductive는ApacheSpark작업실패를진단하는데필요한시간을90%단축하여수시간또는며칠에서10분미만으로줄였으며,연간275,000달러이상의비용절감효과를가져왔습니다.​기술작동방식Deductive의기술적접근방식은Datadog이나NewRelic과같은기존옵저버빌리티플랫폼에추가되는AI기능들과차별화됩니다.이시스템은코드베이스,로그,메트릭,트레이스,내부문서간의관계를매핑하는'지식그래프'를구축합니다.인시던트가발생하면여러AI에이전트가함께협력하여가설을생성하고,이를실시간시스템증거와대조하며,근본원인에수렴합니다—숙련된사이트신뢰성엔지니어가조사하는방식을모방하지만훨씬짧은시간에작업을완료합니다.​플랫폼은기존인프라와읽기전용API를통해옵저버빌리티플랫폼,코드저장소,인시던트관리도구,커뮤니케이션시스템에연결됩니다.강화학습을활용하여지속적으로개선하며,각인시던트에서어떤조사액션이정확한진단으로이어졌는지학습합니다.​공동창립자이자CTO인SameerAgarwal은UCBerkeley에서BlinkDB라는근사쿼리처리프레임워크를개발하며박사학위를받았고,ApacheSpark를구축한초창기Databricks엔지니어중한명이었습니다.Kothari는ThoughtSpot의초기엔지니어로,분산쿼리처리와대규모시스템최적화에집중하는팀을리드했습니다.​"현대인프라의복잡성과상호의존성으로인해장애나인시던트의근본원인을조사하는일은마치건초더미에서바늘을찾는것같습니다.단,그건초더미는축구장크기이고,백만개의다른바늘로만들어졌으며,끊임없이재배열되며불타고있습니다,"라고Agarwal은성명에서밝혔습니다.​기술적으로는프로덕션환경에서바로수정작업을자동화할수있지만,현재회사는엔지니어가검증하고구현할수있도록구체적솔루션을추천하며사람의개입을유지하고있습니다.회사는데이터볼륨이아니라조사된인시던트수를기준으로가격을산정하며,클라우드호스팅과셀프호스팅배포옵션을모두제공합니다.
1017 조회
0 추천
2025.11.13 등록
(퍼플렉시티가정리한기사)우크라이나는수백대의요격드론을자율적으로조정하여들어오는위협에대응할수있는AI기반"드론방어벽"방어시스템을배치한최초의국가가되었으며,러시아의집중적인공중공격에맞서싸우는가운데방공기술의새로운지평을열었습니다.프랑스스타트업Atreyd가개발하고NATO혁신경진대회를통해선정된DWS-1시스템은이번달우크라이나에도착했으며몇주내에작전운용될것으로예상됩니다.이번배치는실제전투상황에서이러한방어시스템이테스트되는최초의사례입니다.​혁명적방어아키텍처이시스템은지상기지에서발사되는200대의1인칭시점요격드론으로구성되어있으며,Atreyd의창립자는이를하늘의"비행하는드론지뢰밭"이라고묘사했다.각드론은단몇천달러의비용이드는소형폭발탄두를탑재하고있으며,들어오는무기근처에서폭발하여목표물에도달하기전에위협을무력화하도록설계되었다.​인공지능을통해단일운영자가최대100대의드론을동시에제어할수있으며,시스템은감지된위협궤적에따라방어막의구조를자동으로조정한다.이기술은3D지형매핑과아군식별시스템을통합하여GPS가차단된환경에서도작동할수있도록하는데,이는러시아가우크라이나에서전자전을광범위하게사용하고있다는점을고려할때매우중요한능력이다.​Atreyd의창립자는BusinessInsider에"우리는스스로를방어의마지막계층으로간주합니다"라고말했다.위협을요격하지않은드론은재사용을위해발사플랫폼으로돌아올수있어운영비용을더욱절감할수있다.​NATO혁신을위한시험장Atreyd는2025년3월에시작된NATO의혁신도전과제에서러시아의활공폭탄과공격드론에대한대응책을개발하기위한3개최종후보중하나로선정되었습니다.다른최종후보로는독일의TYTANTechnologies와프랑스의AltaAres가있으며,이들도현재우크라이나에서테스트중인요격드론시스템을개발했습니다.​드론장벽은초기에러시아의Shahed형배회탄약으로부터도시와주요기반시설을방어할예정입니다.이러한탄약은전례없는수량으로우크라이나에발사되었으며,2025년첫10개월동안44,000발이상이발사되어2024년전체대비303%증가했습니다.이러한위협에대해성공적으로작동한다면,이시스템은전선에더가까이배치되어러시아의활공폭탄을요격할수있으며,이는대응하기매우어려운것으로악명높은파괴적인무기입니다.​​방어력저하속시급한필요이번배치는우크라이나의방공요격률이급격히감소함에따라이루어졌습니다.2025년10월,우크라이나군은들어오는드론의80%를요격했으며,이는연초의거의100%에서감소한수치입니다.지난달에만1,200대이상의러시아미사일과드론이우크라이나방어망을뚫고들어왔으며,이는2월의수치보다거의두배에달합니다.​러시아는최근샤헤드드론과활공폭탄모두에제트엔진을장착하여업그레이드했으며,이를통해더빠르게이동하고전선후방최대200킬로미터까지목표물을타격할수있게되었습니다.이러한개조는우크라이나의전통적인방공시스템에부담을주었으며,비용효율적인요격솔루션의중요성이점점더커지고있습니다.
1032 조회
0 추천
2025.11.13 등록
(퍼플렉시티가정리한기사)AI칩스타트업d-Matrix는시리즈C펀딩에서20억달러밸류에이션으로2억7,500만달러를확보하여,업계가훈련에서대규모대형언어모델배포로초점을전환함에따라AI추론워크로드를구동하는경쟁에서떠오르는도전자로산타클라라기반회사를자리매김했습니다.​11월12일에발표된이초과청약된라운드는BullhoundCapital,TriatomicCapital,Temasek이공동주도했으며,QatarInvestmentAuthority와싱가포르의EDBI가새롭게참여했습니다.의M12벤처펀드와기존투자자인NautilusVenturePartners,IndustryVentures,MiraeAsset도이번라운드에합류하여,d-Matrix의2019년설립이후총펀딩규모를4억5,000만달러로끌어올렸습니다.​AI의다음병목현상타겟팅SidSheth와SudeepBhoja가설립한d-Matrix는일찍이역발상테제에투자했습니다:경쟁사들이AI훈련칩에집중하는동안,진짜도전은기업들이훈련된모델을대규모로연속적으로실행하려고할때올것이라는것이었습니다."우리는훈련된모델이대규모로연속적으로실행되어야할때인프라가준비되지않을것이라고예측했습니다"라고Sheth는성명에서밝혔습니다.​2024년11월에출시된이회사의Corsair가속기는연산과메모리를통합하는DigitalIn-MemoryCompute아키텍처를사용하여d-Matrix가주장하는바에따르면GPU기반시스템보다10배빠른성능,3배낮은비용,최대5배더나은에너지효율성을제공합니다.이플랫폼은Llama70B모델에서토큰당2밀리초로초당최대30,000개의토큰을생성할수있습니다.​시장모멘텀이번자금조달은AI추론시장이급속도로확장되는가운데이루어졌습니다.이분야는생성형AI와대규모언어모델의광범위한배포에힘입어2025년약1,060억달러에서2030년까지2,550억달러로성장할것으로예상됩니다.TriatomicCapital의제너럴파트너인JeffHuber는"AI추론이프로덕션AI시스템에서지배적인비용요소가되고있습니다"라고말했습니다.​d-Matrix는이제추론칩시장에서Nvidia와같은기존업체들과Cerebras,Groq,SambaNova를포함한신흥전문기업들과경쟁하고있습니다.이회사는SantaClara,Toronto,Sydney,Bangalore,Belgrade에있는사무소에서250명이상의직원을고용하고있습니다.​새로운자본은글로벌확장,3D메모리스태킹혁신을포함한회사의제품로드맵추진,그리고하이퍼스케일,엔터프라이즈및주권고객을위한대규모배포지원에사용될예정입니다.MorganStanley는이번거래의독점배치대행사로활동했습니다.
1157 조회
0 추천
2025.11.13 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입