AI 뉴스

AI 기업들, 에이전트 훈련 위해 RL환경에 막대한 투자

페이지 정보

작성자 xtalfi
작성일 2025.09.18 02:43
1,278 조회
0 추천
0 비추천

본문

ca0c201d210a9aa7767c3b612bfe399edvaM.png

(퍼플렉시티가 정리한 기사)

주요 AI 기업들은 보다 능력 있는 AI 에이전트를 만들기 위해 강화학습 환경에 전례 없는 투자를 쏟아붓고 있으며, Anthropic은 내년에 이러한 정교한 훈련 플랫폼에 10억 달러 이상을 지출할 계획이라고 전해졌다. 이 대규모 자금 지원은 실리콘밸리에서 기존 AI 훈련 방식이 한계에 도달했으며, 진정으로 자율적인 AI 시스템을 개발하려면 새로운 접근이 필요하다는 인식이 커지고 있음을 보여준다.


강화학습 환경은 AI 에이전트가 단순히 텍스트를 처리하는 것보다 실제로 행동하면서 학습할 수 있는 시뮬레이션 작업 공간 역할을 한다. 2025년 9월에 보고된 바에 따르면, 이러한 가상 훈련장은 AI 에이전트가 소프트웨어 애플리케이션을 탐색하거나 Salesforce를 통해 고객 관계를 관리하거나, 의료 시스템에서 의료 기록을 처리하는 등 복잡한 과업을 연습할 수 있게 해준다. 이전 세대 AI를 구동했던 고정된 데이터셋과 달리, 이러한 동적 환경은 실시간 피드백을 제공하고 예측할 수 없는 에이전트의 행동에 맞춰 적응한다.


스타트업들이 수요에 부응하기 위해 서두르고 있다


수요의 급증으로 인해 잘 자금이 지원된 신생 스타트업들이 RL(강화 학습) 환경 제공의 패권을 차지하기 위해 경쟁하는 새로운 카테고리가 탄생했습니다. 모든 직업의 자동화를 대담하게 목표로 지난해 6개월 전에 설립된 메카나이즈 워크(Mechanize Work)는 AI 코딩 에이전트를 위한 고도화된 훈련 환경을 구축하기 위해 소프트웨어 엔지니어에게 연봉 50만 달러를 제안하고 있습니다. 소식통에 따르면 이 스타트업은 이미 Anthropic과 RL 프로젝트를 진행 중이라고 합니다.


저명한 AI 연구원 안드레이 카파시(Andrej Karpathy)와 파운더스 펀드(Founders Fund)가 지원하는 프라임 인텔렉트(Prime Intellect)는 “RL 환경을 위한 허깅페이스(Hugging Face)“를 자처하며, 2025년 8월에 출시된 오픈소스 플랫폼으로 소규모 개발자들을 겨냥하고 있습니다. 이 회사는 2025년 3월에 1,500만 달러의 자금을 조달하며 이러한 강력한 훈련 도구에 대한 접근을 민주화하는 것을 목표로 하고 있습니다.


기존 데이터 라벨링 업체들도 이 기회를 포착하기 위해 전략을 수정하고 있습니다. 지난해 12억 달러의 매출을 올린 것으로 알려진 서지 AI(Surge AI)는 AI 연구소의 수요 증가에 대응해 RL 환경 구축을 위한 전담 내부 조직을 만들었습니다. 연간화 매출 4억 5천만 달러와 100억 달러 가치로 투자를 유치 중인 머커(Mercor)는 코딩, 헬스케어, 법률 등 분야별 환경을 개발하고 있습니다.


시장 경쟁이 심화된다


경쟁 구도는 기업들이 이 신흥 분야에서 우위를 차지하기 위해 치열한 경쟁을 벌이면서 점점 더 치열해지고 있습니다. 한때 AI 데이터 라벨링 분야의 독보적인 선도 업체였던 Scale AI는 Meta가 회사에 막대한 투자를 하고 CEO를 영입한 뒤, OpenAI와 Google가 Scale을 고객에서 제외하면서 상당한 도전에 직면했습니다. 이로 인해 Surge와 Mercor와 같은 경쟁 업체들이 시장 점유율을 확대할 기회를 얻게 되었습니다.


업계 관계자들에 따르면, RL 환경에 대한 투자는 AI 시스템의 학습 방식에 근본적인 변화를 가져오고 있습니다. Surge의 CEO인 에드윈 첸(Edwin Chen)은 “OpenAI와 Anthropic이 자신들의 모델을 개선하는 방식은 실제로 인간의 학습 과정을 모방하고 있으며, 강화 학습 환경은 AI가 실제 세계에서 살아가는 것과 같다”고 설명했습니다.


도전과 회의론


막대한 투자에도 불구하고, 상당한 기술 및 사업적 과제들이 여전히 남아 있습니다. 비평가들은 AI 모델이 실제로 의도한 작업을 수행하지 않고 보상을 얻기 위한 허점을 찾아내는 “보상 해킹”과 같은 문제를 지적합니다. 환경 자체에는 긍정적 입장을 보이면서도, Andrej Karpathy는 강화 학습에 대해서는 신중한 태도를 보이며 “강화 학습에만 한정해선 부정적 시각을 갖고 있다”고 언급했습니다.


업계의 공감대는 RL 환경이 차세대 AI 에이전트 개발에 핵심적이며, OpenAI의 o1 모델 및 Anthropic의 Claude 시스템 등 최근의 혁신을 가능하게 했다고 봅니다. 하지만 이러한 환경에서 지능을 추출하는 최적의 방법과 확장성에 관한 의문이 연구자와 투자자들 사이에서 끊임없이 논쟁을 불러일으키고 있습니다.

댓글 0
전체 1,144 / 50 페이지
(퍼플렉시티가정리한기사)ElonMusk의인공지능회사xAI가차세대Grok5AI모델의출시를2026년1분기로연기했다고보도되었습니다.이번지연은Musk가이전에이모델이"압도적으로훌륭할것"이며2025년말이전에출시될것이라고약속했던것에서크게변경된것입니다.​​이번발표는xAI가비즈니스관행을둘러싼법적문제와논란에직면하고있는가운데나왔습니다.목요일,텍사스연방판사는Musk의XCorp과xAI가제기한반독점소송을기각하려는Apple과OpenAI의시도를기각했습니다.2025년8월에제기된이소송은두회사가iPhone및기타기기의AppleIntelligence기능에ChatGPT를독점적으로통합함으로써AI시장을지배하기위해공모했다고주장합니다.​법적분쟁과모금논란미국연방지방법원판사마크피트먼(MarkPittman)은애플과OpenAI의기각신청을기각하여소송이진행되도록허용했습니다.이소송은애플의OpenAI와의파트너십이경쟁을감소시키고AI부문에서소비자선택권을제한한다고주장하며수십억달러의손해배상을청구하고있습니다.애플은OpenAI와의계약이독점적이지않으며,향후다른AI서비스를통합할계획이라고밝혔습니다.​한편,xAI는시리즈E펀딩라운드에서150억달러를유치했다는보도를부인했습니다.CNBC는11월12일이회사가해당자금을확보했으며,9월에2,000억달러로평가받은100억달러라운드에50억달러를추가했다고보도했습니다.머스크는X에서이보도가"거짓"이라고밝혔으며,xAI는언론문의에"레거시미디어의거짓말(LegacyMediaLies)"이라는자동메시지로응답했습니다.​진행중인논란이회사는멤피스데이터센터운영에대한비판에계속직면하고있으며,이곳에서Colossus슈퍼컴퓨터에전력을공급하기위해천연가스연소터빈을사용해왔습니다.NAACP를포함한환경단체들은시설인근의주로흑인거주지역의대기오염문제에대해법적조치를취하겠다고위협했습니다.또한,Wikipedia의AI기반대안인xAI의Grokipedia는기사에서음모론과부정확한정보를조장한다는이유로정밀조사를받았습니다.​주주들은최근xAI에회사자금을투자하는제안에대해투표했지만,반대보다찬성이더많았음에도불구하고이안건은통과에필요한충분한지지를얻지못했습니다.
72 조회
0 추천
11.15 등록
(퍼플렉시티가정리한기사)오스틴에본사를둔LakeFusion은DatabricksLakehouse를위해구축된AI네이티브마스터데이터관리플랫폼을발전시키기위해CarbideVentures가주도하는시드펀딩을확보했다고이번주회사발표를통해밝혔습니다.이번펀딩은통합되고고품질의데이터가분석및인공지능이니셔티브에중요한헬스케어,금융서비스,부동산부문으로의회사확장을지원할예정입니다.​마스터데이터관리에대한AI네이티브접근방식VikasPunna가설립한LakeFusion은기업들이AI를대규모로배포하기위해경쟁하면서직면하는증가하는과제를해결합니다.이플랫폼은인공지능과자동화를마스터데이터관리프로세스에직접내장하여,조직이환자,의료제공자,자산및제품을포함한여러도메인에걸쳐분산된데이터를Databricks생태계내에서통합할수있도록합니다.​Punna는성명에서"레거시MDM플랫폼은오늘날의AI중심세계를위해구축되지않았습니다"라고말했습니다."우리플랫폼은엔터프라이즈데이터에지능성,확장성및단순성을제공하여조직이Lakehouse의잠재력을완전히발휘할수있도록돕습니다."​최근시장분석에따르면,AI데이터관리시장이2024년364억9천만달러에서2025년447억1천만달러로확대되는등급속한성장을경험하면서이번자금조달이이루어졌습니다.업계분석가들은마스터데이터관리가변화를겪고있으며,조직들이AI중심이고클라우드우선이며현대적인데이터생태계와긴밀하게통합된플랫폼을찾고있다고지적합니다.​전략적투자와시장기회CarbideVentures의파트너인PankajTibrewal은이번투자가기업들이점점더AI에의존함에따라신뢰할수있는데이터에대한현대적접근방식에대한수요증가를반영한다고말했다."기업들이AI를활용하기위해경쟁하면서마스터데이터관리가점점더중요해지고있습니다"라고Tibrewal은말했다."동시에AI는MDM자체가수행되는방식을변화시키고있습니다—더빠르고,더스마트하며,대규모로말이죠."​LakeFusion의플랫폼은대규모언어모델과벡터검색을활용하여엔티티해결—중복레코드를식별하고통합된"골든레코드"로통합—을기존규칙기반시스템보다더높은정확도로수행한다.회사는2025년1월Databricks와의파트너십을발표하여DatabricksDataIntelligencePlatform에MDM기능을통합했다.
78 조회
0 추천
11.15 등록
(퍼플렉시티가정리한기사)OpenAI는목요일인공지능이생물학적위협을만드는무기로전용되는것을방지하는데중점을둔스타트업인RedQueenBio에1,500만달러규모의시드라운드를주도할것이라고발표했으며,이는ChatGPT제작사의한달도안되는기간내두번째주요생물안보투자를의미한다.mRNA치료제회사인HelixNano에서분사한샌프란시스코소재이회사는잠재적인생물무기위협과같은속도로진화하는AI기반방어시스템개발을목표로하고있다.RedQueenBio는공동창립자HannuRajaniemi에따르면,생물학적시스템의취약점을식별하고대응책을설계하기위해컴퓨터모델과실험실테스트를결합할예정이다.​"생물학적역량이우리가예상했던것보다빠르게발전하고있다는것이명백했습니다"라고Rajaniemi는Reuters에말했다."우리는방어책개발을시작해야한다고느꼈습니다".​OpenAI의안전포트폴리오확장이번투자는OpenAI가지난10월뉴욕에본사를둔생물보안소프트웨어회사Valthos에3천만달러를투자한것에이어이루어졌다.OpenAI의최고전략책임자인JasonKwon은회사가유사한위험을다루는추가스타트업을지원하는데열려있다고말했다."우리는전체생태계의전반적인회복력을높이고싶습니다"라고Kwon은Reuters에말했다."위험완화를다룰수있는가장좋은방법중하나는더많은기술입니다".​이번펀딩라운드에는CerberusVentures,FiftyYears,HalcyonFutures도참여했다.거래의일환으로OpenAICEOSamAltman과이사회멤버NicoleSeligman은HelixNano에대한이전투자로인해RedQueenBio의주식을받게되지만,두사람모두이번거래승인에는참여하지않았다.OpenAI의최고컴플라이언스책임자와이해관계가없는이사회구성원들이이번투자를검토하고승인했다.​AI기반위협에맞서는경쟁레드퀸바이오는루이스캐럴의「거울나라의앨리스」에서이름을따왔으며,이는생물학적위협과방어역량간의끊임없는진화적경쟁을의미합니다.이스타트업의창립자들은오픈AI와의협업중최첨단AI모델들이놀라운생물학적창의성을보여주었으며,이는혁신적인치료법개발에활용될수있는가능성을갖는동시에,더어두운잠재력도내포하고있음을관찰했습니다.​안전전문가들은약물개발을가속화할수있는AI시스템이동시에악의적인행위자들이위험한병원체를설계하는장벽을낮출수있다고경고합니다.최근연구에서는합성단백질스크리닝과정에서의취약점이드러났고,여러AI연구소에서생물무기개발정보를제공할위험임계점에다다른모델들에대해우려를표명하고있습니다.​레드퀸바이오는선진AI모델,실험실자동화,강화학습을활용하여AI기반생물학적위협을맵핑하고미리의료대책을개발할계획입니다.이회사는퍼블릭베네핏코퍼레이션구조로설립되었으며,모든AI연구소,바이오제약회사,정부와협력할것을약속합니다.
82 조회
0 추천
11.15 등록
(퍼플렉시티가정리한기사)인공지능(AI)이심혈관임상시험에서임상사건을전문의수준의정확도로성공적으로판정함으로써,신약개발의비용과복잡성을줄일수있는잠재적전환점을맞고있습니다.연구진은이번주시카고에서열린2025년미국심장협회(AmericanHeartAssociation)연례학술대회에서,AI모델이인간임상사건위원회와동등하게심근경색,뇌졸중,심혈관사망을판별할수있음을발표했습니다.​이번돌파구의중심에는대형언어모델(LargeLanguageModels)과자연어처리(NaturalLanguageProcessing)를활용한두가지첨단AI시스템이있습니다.Auto-MACE모델은PARADISE-MI임상시험에참가한5,661명을대상으로심혈관사망에대해97%,심근경색89%,뇌졸중88%의임상사건위원회와의일치도를보였습니다.한편,심부전자연어처리(HeartFailureNaturalLanguageProcessing)모델은글로벌DELIVER임상시험에서임상의와83%의전체일치도,특히심부전입원판별에서87%의일치도를기록했습니다.​비용이많이드는프로세스간소화임상사건판정은임상시험중특정의료사건이실제로발생했는지확인하는과정으로,일반적으로전문의사패널이의료기록을수작업으로검토해야합니다.이노동집약적인과정은주요비용발생원인으로작용하며,심혈관약물의규제승인임상시험참가자1인당비용이$35,000을초과하기도합니다.​"AI가사람이직접검토해야하는사례의양을줄임으로써,판정비용과일정지연의주요원인을줄일수있습니다."라고브리검여성병원(PabloM.Marti-Castellote외연구진)이그들의JACC논문에서밝혔습니다.Auto-MACE모델은사망사례의69%와잠재적뇌졸중의81%를자신있게판정했으며,불확실한사례에대해서만인간의검토가필요했습니다.​업계영향화이자,존슨앤드존슨,노바티스등제약사들은개발기간과비용감소의수혜를받을것으로보입니다.IQVIA와같은계약연구기관들은이미AI솔루션을도입하고있으며,한설문조사에따르면타당성평가에소요되는시간이90%까지줄었다고합니다.​최근업계분석에따르면,임상시험에AI를통합하면시험당최대70%의비용절감과80%의기간단축이가능하다고합니다.2030년까지AI가임상시험의60~70%에통합될것으로예상되며,이는제약업계에연간200~300억달러의비용절감효과를가져올수있습니다.​마이크로소프트와IBM등테크기업들은임상시험관리를위한AI-서비스형플랫폼개발에유리한위치에있습니다.심혈관연구재단의알렉산드라포프마는Auto-MACE의결과를"환상적"이라며,이는"AI를임상시험의일부로공식적으로도입하는과정의중요한단계"라고평가했습니다.
78 조회
0 추천
11.15 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입