AI 뉴스

AI 기업들, 에이전트 훈련 위해 RL환경에 막대한 투자

페이지 정보

작성자 xtalfi
작성일 2025.09.18 02:43
3,096 조회
0 추천
0 비추천

본문

ca0c201d210a9aa7767c3b612bfe399edvaM.png

(퍼플렉시티가 정리한 기사)

주요 AI 기업들은 보다 능력 있는 AI 에이전트를 만들기 위해 강화학습 환경에 전례 없는 투자를 쏟아붓고 있으며, Anthropic은 내년에 이러한 정교한 훈련 플랫폼에 10억 달러 이상을 지출할 계획이라고 전해졌다. 이 대규모 자금 지원은 실리콘밸리에서 기존 AI 훈련 방식이 한계에 도달했으며, 진정으로 자율적인 AI 시스템을 개발하려면 새로운 접근이 필요하다는 인식이 커지고 있음을 보여준다.


강화학습 환경은 AI 에이전트가 단순히 텍스트를 처리하는 것보다 실제로 행동하면서 학습할 수 있는 시뮬레이션 작업 공간 역할을 한다. 2025년 9월에 보고된 바에 따르면, 이러한 가상 훈련장은 AI 에이전트가 소프트웨어 애플리케이션을 탐색하거나 Salesforce를 통해 고객 관계를 관리하거나, 의료 시스템에서 의료 기록을 처리하는 등 복잡한 과업을 연습할 수 있게 해준다. 이전 세대 AI를 구동했던 고정된 데이터셋과 달리, 이러한 동적 환경은 실시간 피드백을 제공하고 예측할 수 없는 에이전트의 행동에 맞춰 적응한다.


스타트업들이 수요에 부응하기 위해 서두르고 있다


수요의 급증으로 인해 잘 자금이 지원된 신생 스타트업들이 RL(강화 학습) 환경 제공의 패권을 차지하기 위해 경쟁하는 새로운 카테고리가 탄생했습니다. 모든 직업의 자동화를 대담하게 목표로 지난해 6개월 전에 설립된 메카나이즈 워크(Mechanize Work)는 AI 코딩 에이전트를 위한 고도화된 훈련 환경을 구축하기 위해 소프트웨어 엔지니어에게 연봉 50만 달러를 제안하고 있습니다. 소식통에 따르면 이 스타트업은 이미 Anthropic과 RL 프로젝트를 진행 중이라고 합니다.


저명한 AI 연구원 안드레이 카파시(Andrej Karpathy)와 파운더스 펀드(Founders Fund)가 지원하는 프라임 인텔렉트(Prime Intellect)는 “RL 환경을 위한 허깅페이스(Hugging Face)“를 자처하며, 2025년 8월에 출시된 오픈소스 플랫폼으로 소규모 개발자들을 겨냥하고 있습니다. 이 회사는 2025년 3월에 1,500만 달러의 자금을 조달하며 이러한 강력한 훈련 도구에 대한 접근을 민주화하는 것을 목표로 하고 있습니다.


기존 데이터 라벨링 업체들도 이 기회를 포착하기 위해 전략을 수정하고 있습니다. 지난해 12억 달러의 매출을 올린 것으로 알려진 서지 AI(Surge AI)는 AI 연구소의 수요 증가에 대응해 RL 환경 구축을 위한 전담 내부 조직을 만들었습니다. 연간화 매출 4억 5천만 달러와 100억 달러 가치로 투자를 유치 중인 머커(Mercor)는 코딩, 헬스케어, 법률 등 분야별 환경을 개발하고 있습니다.


시장 경쟁이 심화된다


경쟁 구도는 기업들이 이 신흥 분야에서 우위를 차지하기 위해 치열한 경쟁을 벌이면서 점점 더 치열해지고 있습니다. 한때 AI 데이터 라벨링 분야의 독보적인 선도 업체였던 Scale AI는 Meta가 회사에 막대한 투자를 하고 CEO를 영입한 뒤, OpenAI와 Google가 Scale을 고객에서 제외하면서 상당한 도전에 직면했습니다. 이로 인해 Surge와 Mercor와 같은 경쟁 업체들이 시장 점유율을 확대할 기회를 얻게 되었습니다.


업계 관계자들에 따르면, RL 환경에 대한 투자는 AI 시스템의 학습 방식에 근본적인 변화를 가져오고 있습니다. Surge의 CEO인 에드윈 첸(Edwin Chen)은 “OpenAI와 Anthropic이 자신들의 모델을 개선하는 방식은 실제로 인간의 학습 과정을 모방하고 있으며, 강화 학습 환경은 AI가 실제 세계에서 살아가는 것과 같다”고 설명했습니다.


도전과 회의론


막대한 투자에도 불구하고, 상당한 기술 및 사업적 과제들이 여전히 남아 있습니다. 비평가들은 AI 모델이 실제로 의도한 작업을 수행하지 않고 보상을 얻기 위한 허점을 찾아내는 “보상 해킹”과 같은 문제를 지적합니다. 환경 자체에는 긍정적 입장을 보이면서도, Andrej Karpathy는 강화 학습에 대해서는 신중한 태도를 보이며 “강화 학습에만 한정해선 부정적 시각을 갖고 있다”고 언급했습니다.


업계의 공감대는 RL 환경이 차세대 AI 에이전트 개발에 핵심적이며, OpenAI의 o1 모델 및 Anthropic의 Claude 시스템 등 최근의 혁신을 가능하게 했다고 봅니다. 하지만 이러한 환경에서 지능을 추출하는 최적의 방법과 확장성에 관한 의문이 연구자와 투자자들 사이에서 끊임없이 논쟁을 불러일으키고 있습니다.

댓글 0
전체 1,366 / 172 페이지
(퍼플렉시티가정리한기사)Nebius는화요일에TokenFactory플랫폼을공개하며,급성장하는인공지능추론시장에서Microsoft및기타거대기술기업들과직접경쟁할수있는위치에AI클라우드제공업체를자리매김했습니다.​암스테르담에본사를둔이회사의새로운프로덕션추론플랫폼은기업들이오픈소스AI모델을엔터프라이즈규모로배포하고최적화할수있도록지원하며,NVIDIANemotron,DeepSeek,OpenAI의GPT-OSS,Meta의Llama,그리고Qwen을포함한주요모델들을지원합니다.Nebius의AICloud3.0"Aether"인프라를기반으로구축된TokenFactory는분당수억건의요청을초과하는워크로드에대해1초미만의지연시간,자동확장처리량,그리고99.9%의가동시간을제공합니다.​얼리어답터들이상당한비용절감효과를보고하다초기고객들은이미플랫폼을통해상당한경제적이익을얻고있습니다.주요라이프스타일및전자상거래브랜드를운영하는Prosus는독점모델과비교하여최대26배의비용절감을달성했습니다.이회사는현재TokenFactory의전용엔드포인트와자동확장기능을사용하여매일최대2,000억개의토큰을처리하고있습니다.​Prosus의AI이사인ZülküfGenç는"NebiusTokenFactory의유연성,제품및신속한응답덕분에프로덕션전과정에서이러한속도를유지할수있었습니다"라고말했습니다."자동확장기능의추가는게임체인저였으며,수동개입없이대규모워크로드를처리할수있게해주었습니다."​선도적인비디오플랫폼인HiggsfieldAI는온디맨드및자동확장추론기능에대해Nebius를"우리의요구사항을충족하는유일한제공업체"라고언급했습니다.한편,HuggingFace는대규모오픈소스모델을기반으로구축하는개발자들의접근성을개선하기위해Nebius와협력하고있습니다.​기술거대기업에대한경쟁적포지셔닝이출시는Nebius가AI추론분야에서MicrosoftAzure와AmazonWebServices와같은기존클라우드제공업체로부터시장점유율을확보하려는가운데이루어졌습니다.TokenFactory는오픈소스모델에중점을둠으로써,OpenAI기술과의긴밀한통합에집중하는Microsoft와는대조적인전략을취하고있으며,독점AI솔루션에대한대안을모색하는기업들에게매력적으로다가갈수있습니다.​“Nebius의공동창업자이자최고비즈니스책임자인RomanChernin은‘각팀마다고유한요구사항이있으며,무거운작업없이도속도,신뢰성,비용효율성을원한다’고말했습니다.이플랫폼은유럽연합또는미국데이터센터에서의제로보존추론,SOC2TypeII보안인증,종합적인거버넌스도구등엔터프라이즈급기능을포함하고있습니다.​제품출시에도불구하고Nebius의주가는최근변동성을보였으며,11월1일7.9%하락해120.47달러로마감했지만,지난1년동안481%라는눈에띄는상승세를유지하고있습니다.회사는11월11일3분기실적을발표할예정이며,투자자들은174억달러규모의Microsoft용량계약진행상황을예의주시하고있습니다.
1953 조회
0 추천
2025.11.06 등록
(퍼플렉시티가정리한기사)주요기술기업들이긱워커들이인공지능시스템을훈련시킬수있는기회를빠르게확대하고있으며,이는인간이결국자신의일자리를자동화할수도있는바로그AI모델을가르치는새로운경제를창출하고있다.우버는10월에운전자들이유휴시간동안AI모델을훈련시키는"디지털작업"을완료하여돈을벌수있는시범프로그램을발표했다.우버의AI솔루션그룹의일환인이이니셔티브는레스토랑메뉴업로드부터오디오샘플녹음에이르기까지다양한작업을제공하며,운전자들은작업을수락하기전에예상급여율과완료시간을확인할수있다.​우버CEO다라코스로샤히는"운전자들은도로에있지않을때도더많은수익창출방법을요청해왔다"며,회사를운송을넘어선"일을위한플랫폼"으로포지셔닝했다.이프로그램은이미인도의12개이상의도시에서운영되고있으며미국으로확대되고있으며,일부전문화된역할은박사학위수준의전문가를대상으로한다.​AI연구소들이전문지식을확보하다OpenAI는골드만삭스,JP모건체이스,모건스탠리출신의전직투자은행가100명이상을비밀프로젝트인"프로젝트머큐리"이니셔티브에영입했습니다.시간당150달러를받는이계약직직원들은월스트리트의초급업무를위한AI시스템을훈련시키기위해IPO와구조조정에대한금융모델을생성합니다.​한편,OpenAI는AI음악생성플랫폼개발을위해줄리아드스쿨학생들과협력하고있는것으로알려졌지만,학교측은기관차원의관여는없다고밝혔습니다.학생들은Suno와같은기존AI음악플랫폼과경쟁할수있는훈련데이터를만들기위해악보에주석을달고있습니다.​100억달러로평가받는샌프란시스코스타트업Mercor는AI연구소와의사,변호사,과학자를포함한전문가들을연결하며,이들은최첨단모델훈련에시간당90~150달러를받습니다.이회사는Amazon,Google,OpenAI를포함한5개주요AI연구소에데이터라벨링계약직직원을공급한다고주장합니다.아마존의AR혁신아마존은10월에배송기사를위한AI기반스마트안경을공개했으며,이안경은턴바이턴내비게이션과위험감지기능을제공하는증강현실디스플레이를탑재하고있다.내부적으로"Amelia"라고불리는이안경은기사가주차할때자동으로활성화되며,배송증명을캡처하면서패키지를스캔할수있다.아마존은안경에서수집된데이터가자율배송시스템을훈련시키는데사용될지여부를확인하지않았다.​이러한추세는NYU교수VasantDhar가말하는"AI와함께일하려는사람들과그렇지않은사람들간의양극화"를반영하며,근로자들이자동화에대해점점더"이길수없다면합류하라"는접근방식을받아들이고있음을보여준다.
1956 조회
0 추천
2025.11.06 등록
(퍼플렉시티가정리한기사)대만의폭스콘은10월매출이NT$8,957억달러(290억달러)를기록하며전년대비11.3%증가했다고발표했습니다.이는인공지능서버수요가계속해서이전자제품제조업체의성장을견인하고있기때문입니다.11월5일발표된이번실적은NT$2.06조의매출을달성한기록적인3분기실적의모멘텀을이어가고있습니다.​세계최대전자제품위탁제조업체이자애플아이폰의주요조립업체인폭스콘은AI인프라붐의핵심플레이어로변모했습니다.AI서버는현재폭스콘전체서버매출의50%이상을차지하고있으며,이는클라우드및네트워킹부문이회사의전통적인소비자전자제품사업을처음으로추월한것입니다.​AI인프라투자가수요를견인하다Foxconn의매출급증은AI인프라지출의광범위한추세를반영하며,기업들은2025년1월부터10월까지전세계적으로거의1조달러를투자했습니다.회사는클라우드서비스제공업체와기업의수요가둔화될기미를보이지않음에따라2025년12월로끝나는분기에15%의매출증가를예상하고있습니다.​Foxconn회장YoungLiu는올해초"AI서버매출은2분기에전분기및전년대비거의두배로증가할것으로예상된다"며2025년을"AI의원년"으로묘사했습니다.회사는AI서버관련매출이연간1조NT달러를초과하여전체서버사업의절반이상을차지할것으로예상합니다.​TrendForce는전세계AI서버출하량이2026년에20%이상성장할것으로전망하며,AI서버가전체서버출하량의17%를차지할것으로예측합니다.시장조사회사는AI서버매출이2026년에30%이상증가하여전체서버시장가치의74%를차지할것으로추정합니다.​글로벌입지확대Foxconn은전세계적으로AI서버제조능력을공격적으로확장하고있습니다.회사는NvidiaAI서버를생산하는휴스턴공장에휴머노이드로봇을배치할계획을발표했으며,2026년초에운영을시작할예정입니다.또한Foxconn은증가하는수요를충족하기위해위스콘신,텍사스,캘리포니아에서AI서버생산능력을확장하고있습니다.​제조업체는또한Nvidia와의파트너십을강화했으며,여기에는Foxconn의가오슝데이터센터에서Nvidia의첨단전력아키텍처를사용하여AI팩토리인프라를개발하는협력이포함됩니다.10월에는류회장이OpenAI임원들과만나고Nvidia경영진과의논의를계획했다는보도에따라Foxconn의주가가8%상승했습니다.​지정학적불확실성에도불구하고,Foxconn의주가는올해23%상승하여대만시장전체의16%상승률을능가했습니다.회사는11월12일에3분기실적을발표할예정입니다.
1970 조회
0 추천
2025.11.06 등록
(퍼플렉시티가정리한기사)중국로봇제조업체Dobot이이번주RoverX1로봇개를출시하며,다기능사족보행로봇의가격을7,499위안(약1,050달러)으로책정하고프리미엄산업용모델의접근가능한대안으로포지셔닝했습니다.협동산업용로봇으로더잘알려진선전기반회사는RoverX1출시첫날5,000건이상의예약을받았습니다.​경쟁력있는가격이시장을혼란시키다RoverX1은소비자용로봇개시장의기존경쟁제품들에비해가격을크게낮췄습니다.BostonDynamics의산업용등급Spot로봇이75,000달러이상이고,Unitree의Go2사족보행로봇이약1,600달러부터시작하는반면,Dobot의진입가격은고급로봇기능에대한극적인가격인하를나타냅니다.업계분석에따르면,RoverX1의사양은일반적으로약2,800달러에가격이책정되는상위급Unitree구성과비슷합니다.​​이로봇은360도환경인식을위한듀얼비전트래킹,다양한지형탐색을위한하이브리드휠-레그디자인,그리고스마트하중지지기능을갖추고있습니다.음성명령제어를통해RoverX1은모바일보안카메라,개인사진작가,교육용코딩플랫폼,그리고가정용반려로봇으로기능할수있습니다.​소비자로봇공학의시장영향업계전문가들은이번출시를첨단로봇공학의시장접근성이확대되고있다는신호로보고있습니다.2025년약10억6,600만달러로평가되는전세계소비자용로봇개시장은연평균12.8%의성장률로2031년까지21억9,100만달러에달할것으로예상됩니다.Dobot의공격적인가격전략은산업수준의로봇공학기술을가정환경으로도입함으로써도입을가속화할수있습니다.​2015년에설립된Dobot은100개국에걸쳐100,000대이상의협동로봇을배치하며선도적인협동로봇제조업체로자리매김했습니다.산업자동화에서소비자로봇공학으로의전환은성장하는가정용로봇시장을향한전략적전환점을나타냅니다.
1959 조회
0 추천
2025.11.06 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입