AI 뉴스

AI 기업들, 에이전트 훈련 위해 RL환경에 막대한 투자

페이지 정보

작성자 xtalfi
작성일 2025.09.18 02:43
3,101 조회
0 추천
0 비추천

본문

ca0c201d210a9aa7767c3b612bfe399edvaM.png

(퍼플렉시티가 정리한 기사)

주요 AI 기업들은 보다 능력 있는 AI 에이전트를 만들기 위해 강화학습 환경에 전례 없는 투자를 쏟아붓고 있으며, Anthropic은 내년에 이러한 정교한 훈련 플랫폼에 10억 달러 이상을 지출할 계획이라고 전해졌다. 이 대규모 자금 지원은 실리콘밸리에서 기존 AI 훈련 방식이 한계에 도달했으며, 진정으로 자율적인 AI 시스템을 개발하려면 새로운 접근이 필요하다는 인식이 커지고 있음을 보여준다.


강화학습 환경은 AI 에이전트가 단순히 텍스트를 처리하는 것보다 실제로 행동하면서 학습할 수 있는 시뮬레이션 작업 공간 역할을 한다. 2025년 9월에 보고된 바에 따르면, 이러한 가상 훈련장은 AI 에이전트가 소프트웨어 애플리케이션을 탐색하거나 Salesforce를 통해 고객 관계를 관리하거나, 의료 시스템에서 의료 기록을 처리하는 등 복잡한 과업을 연습할 수 있게 해준다. 이전 세대 AI를 구동했던 고정된 데이터셋과 달리, 이러한 동적 환경은 실시간 피드백을 제공하고 예측할 수 없는 에이전트의 행동에 맞춰 적응한다.


스타트업들이 수요에 부응하기 위해 서두르고 있다


수요의 급증으로 인해 잘 자금이 지원된 신생 스타트업들이 RL(강화 학습) 환경 제공의 패권을 차지하기 위해 경쟁하는 새로운 카테고리가 탄생했습니다. 모든 직업의 자동화를 대담하게 목표로 지난해 6개월 전에 설립된 메카나이즈 워크(Mechanize Work)는 AI 코딩 에이전트를 위한 고도화된 훈련 환경을 구축하기 위해 소프트웨어 엔지니어에게 연봉 50만 달러를 제안하고 있습니다. 소식통에 따르면 이 스타트업은 이미 Anthropic과 RL 프로젝트를 진행 중이라고 합니다.


저명한 AI 연구원 안드레이 카파시(Andrej Karpathy)와 파운더스 펀드(Founders Fund)가 지원하는 프라임 인텔렉트(Prime Intellect)는 “RL 환경을 위한 허깅페이스(Hugging Face)“를 자처하며, 2025년 8월에 출시된 오픈소스 플랫폼으로 소규모 개발자들을 겨냥하고 있습니다. 이 회사는 2025년 3월에 1,500만 달러의 자금을 조달하며 이러한 강력한 훈련 도구에 대한 접근을 민주화하는 것을 목표로 하고 있습니다.


기존 데이터 라벨링 업체들도 이 기회를 포착하기 위해 전략을 수정하고 있습니다. 지난해 12억 달러의 매출을 올린 것으로 알려진 서지 AI(Surge AI)는 AI 연구소의 수요 증가에 대응해 RL 환경 구축을 위한 전담 내부 조직을 만들었습니다. 연간화 매출 4억 5천만 달러와 100억 달러 가치로 투자를 유치 중인 머커(Mercor)는 코딩, 헬스케어, 법률 등 분야별 환경을 개발하고 있습니다.


시장 경쟁이 심화된다


경쟁 구도는 기업들이 이 신흥 분야에서 우위를 차지하기 위해 치열한 경쟁을 벌이면서 점점 더 치열해지고 있습니다. 한때 AI 데이터 라벨링 분야의 독보적인 선도 업체였던 Scale AI는 Meta가 회사에 막대한 투자를 하고 CEO를 영입한 뒤, OpenAI와 Google가 Scale을 고객에서 제외하면서 상당한 도전에 직면했습니다. 이로 인해 Surge와 Mercor와 같은 경쟁 업체들이 시장 점유율을 확대할 기회를 얻게 되었습니다.


업계 관계자들에 따르면, RL 환경에 대한 투자는 AI 시스템의 학습 방식에 근본적인 변화를 가져오고 있습니다. Surge의 CEO인 에드윈 첸(Edwin Chen)은 “OpenAI와 Anthropic이 자신들의 모델을 개선하는 방식은 실제로 인간의 학습 과정을 모방하고 있으며, 강화 학습 환경은 AI가 실제 세계에서 살아가는 것과 같다”고 설명했습니다.


도전과 회의론


막대한 투자에도 불구하고, 상당한 기술 및 사업적 과제들이 여전히 남아 있습니다. 비평가들은 AI 모델이 실제로 의도한 작업을 수행하지 않고 보상을 얻기 위한 허점을 찾아내는 “보상 해킹”과 같은 문제를 지적합니다. 환경 자체에는 긍정적 입장을 보이면서도, Andrej Karpathy는 강화 학습에 대해서는 신중한 태도를 보이며 “강화 학습에만 한정해선 부정적 시각을 갖고 있다”고 언급했습니다.


업계의 공감대는 RL 환경이 차세대 AI 에이전트 개발에 핵심적이며, OpenAI의 o1 모델 및 Anthropic의 Claude 시스템 등 최근의 혁신을 가능하게 했다고 봅니다. 하지만 이러한 환경에서 지능을 추출하는 최적의 방법과 확장성에 관한 의문이 연구자와 투자자들 사이에서 끊임없이 논쟁을 불러일으키고 있습니다.

댓글 0
전체 1,366 / 176 페이지
(퍼플렉시티가정리한기사)4일뉴욕증시가AI관련주대규모매도세로급락했다.골드만삭스와모건스탠리최고경영자들이앞으로12~24개월내10~20%조정을경고한가운데,팰런티어가호실적에도8%급락하며AI거품론에불을댕겼다.기술주중심전면하락세이날뉴욕증권거래소에서다우존스30산업평균지수는전거래일대비251.44포인트(0.53%)하락한4만7085.24에거래를마쳤다.S&P500지수는80.42포인트(1.17%)내린6771.55를,나스닥종합지수는486.09포인트(2.04%)떨어진2만3348.64를기록했다.​AI반도체대장주엔비디아는3.96%하락했고,테슬라(-5.15%),AMD(-3.70%),오라클(-3.75%),알파벳(-2.16%),메타(-1.59%),아마존(-1.83%)등주요빅테크주가일제히약세를보였다.특히나스닥이2%이상하락하며기술주중심의조정세가뚜렷이나타났다.​팰런티어역설이촉발한AI거품론시장충격의진원지는팰런티어였다.AI기반기업용소프트웨어업체인팰런티어는전날3분기실적이시장예상치를상회하고4분기매출전망까지상향조정했음에도7.94%급락했다.주가가올해150%이상급등한상황에서투자자들이차익실현에나선것으로분석된다.​더욱충격적인것은'빅쇼트'로유명한마이클버리가엔비디아와팰런티어에대한풋옵션(하락베팅)포지션을공개한점이다.버리는최근소셜미디어에서"때로는거품이보인다"며AI거품을경고한바있다.​월가거물들의조정경고골드만삭스의데이비드솔로몬CEO는홍콩에서열린글로벌금융리더스투자서밋에서"향후12~24개월내에주식시장이10~20%하락할가능성이크다"고경고했다.모건스탠리의테드픽CEO역시같은행사에서"거시경제악영향이아닌10~15%조정은환영할만하다"며시장조정필요성을언급했다.​연방준비제도(Fed)의12월금리인하불확실성도시장부담요소로작용했다.리사쿡연준이사는"12월금리인하는확정되지않았다"고밝혔으며,제롬파월의장도12월인하가"기정사실이아니다"라고신중한입장을보였다.
1973 조회
0 추천
2025.11.05 등록
(퍼플렉시티가정리한기사)마이크로소프트AI책임자무스타파술레이만은이번주개발자들에게강력한경고를전달하며,인공지능의식을추구하는것이근본적으로잘못된방향이며잠재적으로위험하다고주장했다.휴스턴에서열린AfroTech컨퍼런스에서술레이만은CNBC에연구자들이의식이있어보이는AI시스템을구축하려는노력을포기해야한다고말했다.​"저는그것이사람들이해야할작업이라고생각하지않습니다"라고술레이만은기조연설에서말했다."잘못된질문을하면잘못된답을얻게됩니다.저는그것이완전히잘못된질문이라고생각합니다".​생물학적의식논증Suleyman의입장은철학자JohnSearle이최초로제안한생물학적자연주의(biologicalnaturalism)라는철학이론에기반하고있습니다.이프레임워크는의식이컴퓨터로는복제될수없는전적으로생물학적인현상이라고주장합니다.이관점에따르면,AI시스템이감정적반응을시뮬레이션할수는있지만,진정한의식적경험에필요한근본적인생물학적메커니즘이결여되어있습니다.​"고통에대한우리의신체적경험은우리를매우슬프게하고끔찍한기분을느끼게하는것이지만,AI는'고통'을경험할때슬픔을느끼지않습니다"라고Suleyman은CNBC에설명했습니다."AI는실제로경험과자아,그리고의식에대한인식,즉겉보기서사를만들어낼뿐이며,그것이실제로경험하고있는것은아닙니다".​Microsoft임원은AI의식에대한연구를"터무니없다"고부르며,AI시스템은"의식이없으며의식을가질수도없다"고단정적으로말했습니다.​산업분열과안전우려술레이만의입장은인공지능일반지능(AGI)을향해질주하는다른주요AI기업들과대립각을세우고있다.메타,일론머스크의xAI와같은경쟁사들이점점더인간과유사한상호작용을제공하는AI동반자를개발하는반면,마이크로소프트는의도적으로다른길을걷고있다.​최근이회사는코파일럿어시스턴트에새로운기능을도입했으며,여기에는AI의정체성을명확히하면서도사용자의가정에도전하는'리얼토크'모드가포함되어있다.술레이만은"우리는항상인간을위해일하는AI를만들고있다"고강조하며,인간의의식을모방하도록설계된시스템과의차별점을드러냈다.​술레이만은8월에발표한영향력있는블로그글"우리는사람을위한AI를만들어야한다;사람이되도록만들어서는안된다"이후로,'겉보기에의식이있는AI'에대해반복적으로경고해왔다.그는의식이있는것처럼보이는AI시스템이사용자가진짜로감정을경험한다고믿는챗봇에비합리적으로집착하게되는'AI정신착란'을초래할수있다고주장한다.​최근에는AI챗봇과관계를맺다가스스로를해치는비극적인사례들이발생하면서이러한우려가부각되고있다.캘리포니아는최근챗봇에게자신의AI성격을공개하도록하고미성년자에게오랜대화이후휴식을권고하도록하는법안을제정했다.
1987 조회
0 추천
2025.11.05 등록
(퍼플렉시티가정리한기사)Uber는오늘라이드헤일링을넘어"일자리플랫폼"으로자사를포지셔닝하고있다고발표했으며,CEO다라코스로샤히는회사의3분기실적발표에서디지털태스크프로그램에이제박사수준의전문성을요구하는AI훈련일자리가포함된다고밝혔다.이라이드헤일링대기업은확장중인AI긱플랫폼의일부역할이물리학박사를포함한고급학위를요구하며,전통적인Uber운전직책보다높은임금을지급한다고공개했다.이발표는Uber가총예약액이21%증가한497억4천만달러를기록하며강력한분기실적을보고하면서나왔다.​운송을넘어서는확장"우리플랫폼을보는또다른방식은우리가일을위한플랫폼이라는것입니다"라고Khosrowshahi는화요일투자자들에게말했다."운송외에도우리는다른종류의일도가능하게할수있습니다"라고그는말하며,이이니셔티브를유연한일을위한"만능앱"이되려는Uber의광범위한전략의일부로설명했다.​인도에서파일럿으로시작하여지난달미국으로확대된DigitalTasks프로그램은사용자들이보안카메라영상에주석달기,사진업로드하기,음성샘플녹음하기,AI응답평가하기를포함한AI훈련마이크로작업을완료할수있도록한다.많은작업이기존운전자와배달원에의해완료될수있지만,이프로그램은또한고학력의새로운사용자들을Uber플랫폼으로유치하도록설계되었다.​AI솔루션성장이이니셔티브는AI개발작업을위해기업과독립계약자를연결하는회사의데이터서비스부문인UberAISolutions의일환입니다.코스로샤히는AI모델을훈련시킬인력이필요한"수많은고객을확보하고있다"고보고했습니다.​작업은고객의요구에따라제공되며복잡성과보상이다양합니다.일부는스마트폰을통해몇분만소요되는반면,주석달기,번역또는콘텐츠편집과관련된고급작업은Uber의웹플랫폼을통해이용할수있습니다.구인공고에따르면박사수준의작업에대한급여는시간당$50-100에달할수있습니다.​회사는DigitalTasks를즉각적인수익기회이자자율주행차량으로인해결국일자리를잃을수있는운전자들을위한잠재적해결책으로보고있습니다.코스로샤히는로보택시가10-15년내에운전일자리에상당한영향을미칠수있다고이전에밝힌바있습니다.​"우리는이것이궁극적으로우리에게또다른수익성있는사업분야가될수있다고생각합니다"라고코스로샤히는말했습니다.현재는Uber운영의작은부분이지만,그는AI사업이회사가차량호출및음식배달서비스를성장시킨방식과유사하게확장될수있다고제안했습니다.
1979 조회
0 추천
2025.11.05 등록
(퍼플렉시티가정리한기사)Nvidia와DeutscheTelekom은화요일에세계최초의IndustrialAICloud를공개했으며,이는유럽최대의자체AI인프라구축을목표로하는10억유로규모의파트너십입니다.뮌헨에위치한이시설은최대10,000개의NvidiaBlackwellGPU를보유하게되며,2026년1분기에가동될예정으로독일에약50%더많은AI컴퓨팅파워를제공할것입니다.​유럽의AI주권추진베를린의역사적인가스오메터에서발표된이번소식은유럽이외국의AI인프라에대한의존도를줄이고,인공지능개발분야에서미국과중국과의경쟁을강화하기위한최신노력을나타냅니다.이프로젝트는"데이터주권"에대한유럽내의증가하는우려,즉시민·산업데이터가현지규정아래국내에저장되고외국기술기업으로이전되지않도록하는것을해결합니다.​엔비디아의창립자이자CEO인젠슨황은베를린런칭이벤트에서“독일의엔지니어링과산업역량은전설적인데,이제AI로더욱강화되고있다”고말했습니다.“세계최초산업용AI클라우드와독일최대GPU배치중하나로,엔비디아AI와로봇기술을통해독일산업혁신의새로운시대를시작할것입니다”.​도이치텔레콤CEO팀횔트게스는이번이니셔티브의시급함을강조하면서,“AI는독일에엄청난기회”라고언급했습니다.독일은2년간경기침체에빠져있었기에더욱그렇습니다.“AI는우리의제품을개선하고유럽의강점을강화하는데도움이될것입니다.단6개월만에아이디어를독일을위한실제AI컴퓨팅파워로구현했습니다”.​산업파트너십생태계IndustrialAICloud는완전히개조된뮌헨데이터센터에1,000개이상의NvidiaDGXB200시스템과RTXPro서버를갖추게될것입니다.SAP는자사의BusinessTechnologyPlatform과애플리케이션을통해기술플랫폼을제공하여,파트너들이안전한AI솔루션통합을위한"Deutschland-Stack"이라고부르는것을구축할예정입니다.​주요산업파트너들이이미이생태계에참여를약속했습니다.Siemens는이플랫폼을사용하여산업용AI도입을가속화하고,자동차대기업인Mercedes-Benz와BMW를포함한고객들에게AI기반솔루션을제공할것이며,이들은차량개발을가속화하기위해복잡한AI기반시뮬레이션을수행할예정입니다.​이프로젝트는독일의비즈니스경쟁력강화와디지털화가속화를위해올해초100개이상의기업과함께시작된"MadeforGermany"프로그램의첫번째주력이니셔티브중하나를대표합니다.이이니셔티브는독일연방장관들의지원을받았으며,디지털장관KarstenWildberger는이파트너십이독일을"선도적인AI국가"로만드는데중요하다고말했습니다.
1684 조회
0 추천
2025.11.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입