AI 뉴스

AI 기업들, 에이전트 훈련 위해 RL환경에 막대한 투자

페이지 정보

작성자 xtalfi
작성일 2025.09.18 02:43
525 조회
0 추천
0 비추천

본문

ca0c201d210a9aa7767c3b612bfe399edvaM.png

(퍼플렉시티가 정리한 기사)

주요 AI 기업들은 보다 능력 있는 AI 에이전트를 만들기 위해 강화학습 환경에 전례 없는 투자를 쏟아붓고 있으며, Anthropic은 내년에 이러한 정교한 훈련 플랫폼에 10억 달러 이상을 지출할 계획이라고 전해졌다. 이 대규모 자금 지원은 실리콘밸리에서 기존 AI 훈련 방식이 한계에 도달했으며, 진정으로 자율적인 AI 시스템을 개발하려면 새로운 접근이 필요하다는 인식이 커지고 있음을 보여준다.


강화학습 환경은 AI 에이전트가 단순히 텍스트를 처리하는 것보다 실제로 행동하면서 학습할 수 있는 시뮬레이션 작업 공간 역할을 한다. 2025년 9월에 보고된 바에 따르면, 이러한 가상 훈련장은 AI 에이전트가 소프트웨어 애플리케이션을 탐색하거나 Salesforce를 통해 고객 관계를 관리하거나, 의료 시스템에서 의료 기록을 처리하는 등 복잡한 과업을 연습할 수 있게 해준다. 이전 세대 AI를 구동했던 고정된 데이터셋과 달리, 이러한 동적 환경은 실시간 피드백을 제공하고 예측할 수 없는 에이전트의 행동에 맞춰 적응한다.


스타트업들이 수요에 부응하기 위해 서두르고 있다


수요의 급증으로 인해 잘 자금이 지원된 신생 스타트업들이 RL(강화 학습) 환경 제공의 패권을 차지하기 위해 경쟁하는 새로운 카테고리가 탄생했습니다. 모든 직업의 자동화를 대담하게 목표로 지난해 6개월 전에 설립된 메카나이즈 워크(Mechanize Work)는 AI 코딩 에이전트를 위한 고도화된 훈련 환경을 구축하기 위해 소프트웨어 엔지니어에게 연봉 50만 달러를 제안하고 있습니다. 소식통에 따르면 이 스타트업은 이미 Anthropic과 RL 프로젝트를 진행 중이라고 합니다.


저명한 AI 연구원 안드레이 카파시(Andrej Karpathy)와 파운더스 펀드(Founders Fund)가 지원하는 프라임 인텔렉트(Prime Intellect)는 “RL 환경을 위한 허깅페이스(Hugging Face)“를 자처하며, 2025년 8월에 출시된 오픈소스 플랫폼으로 소규모 개발자들을 겨냥하고 있습니다. 이 회사는 2025년 3월에 1,500만 달러의 자금을 조달하며 이러한 강력한 훈련 도구에 대한 접근을 민주화하는 것을 목표로 하고 있습니다.


기존 데이터 라벨링 업체들도 이 기회를 포착하기 위해 전략을 수정하고 있습니다. 지난해 12억 달러의 매출을 올린 것으로 알려진 서지 AI(Surge AI)는 AI 연구소의 수요 증가에 대응해 RL 환경 구축을 위한 전담 내부 조직을 만들었습니다. 연간화 매출 4억 5천만 달러와 100억 달러 가치로 투자를 유치 중인 머커(Mercor)는 코딩, 헬스케어, 법률 등 분야별 환경을 개발하고 있습니다.


시장 경쟁이 심화된다


경쟁 구도는 기업들이 이 신흥 분야에서 우위를 차지하기 위해 치열한 경쟁을 벌이면서 점점 더 치열해지고 있습니다. 한때 AI 데이터 라벨링 분야의 독보적인 선도 업체였던 Scale AI는 Meta가 회사에 막대한 투자를 하고 CEO를 영입한 뒤, OpenAI와 Google가 Scale을 고객에서 제외하면서 상당한 도전에 직면했습니다. 이로 인해 Surge와 Mercor와 같은 경쟁 업체들이 시장 점유율을 확대할 기회를 얻게 되었습니다.


업계 관계자들에 따르면, RL 환경에 대한 투자는 AI 시스템의 학습 방식에 근본적인 변화를 가져오고 있습니다. Surge의 CEO인 에드윈 첸(Edwin Chen)은 “OpenAI와 Anthropic이 자신들의 모델을 개선하는 방식은 실제로 인간의 학습 과정을 모방하고 있으며, 강화 학습 환경은 AI가 실제 세계에서 살아가는 것과 같다”고 설명했습니다.


도전과 회의론


막대한 투자에도 불구하고, 상당한 기술 및 사업적 과제들이 여전히 남아 있습니다. 비평가들은 AI 모델이 실제로 의도한 작업을 수행하지 않고 보상을 얻기 위한 허점을 찾아내는 “보상 해킹”과 같은 문제를 지적합니다. 환경 자체에는 긍정적 입장을 보이면서도, Andrej Karpathy는 강화 학습에 대해서는 신중한 태도를 보이며 “강화 학습에만 한정해선 부정적 시각을 갖고 있다”고 언급했습니다.


업계의 공감대는 RL 환경이 차세대 AI 에이전트 개발에 핵심적이며, OpenAI의 o1 모델 및 Anthropic의 Claude 시스템 등 최근의 혁신을 가능하게 했다고 봅니다. 하지만 이러한 환경에서 지능을 추출하는 최적의 방법과 확장성에 관한 의문이 연구자와 투자자들 사이에서 끊임없이 논쟁을 불러일으키고 있습니다.

댓글 0
전체 486 / 65 페이지
(퍼플렉시티가 정리한 기사)알리바바은 2025년 9월 18일에 오픈소스 Tongyi DeepResearch AI 에이전트를 공개하며, AI 연구 분야에서 OpenAI의 지배적 위치에 중요한 도전을 제기했습니다. 300억 개의 파라미터를 가진 이 모델은 OpenAI의 대표적인 Deep Research 도구와 동급의 성능을 발휘하는 동시에 효율성을 획기적으로 향상시켰다고 주장합니다.주요 벤치마크에서 오픈AI 능가중국의 기술 대기업은 여러 산업 표준 벤치마크에서 우수한 성능을 시연했습니다. 예를 들어, Humanity’s Last Exam에서 32.9%의 정확도를 달성해 OpenAI의 Deep Research 점수인 26.6%를 능가했습니다. 해당 모델은 또한 BrowseComp 영어에서 43.4%, 중국어에서 46.7%를 기록했고, xbench-DeepSearch에서 75%의 점수를 획득했습니다.알리바바에 따르면, Tongyi DeepResearch는 미국의 독점 도구들과 비교해 “놀라운 효율성”을 보여주며 300억 개의 파라미터만을 사용합니다. 이는 미국의 딥 리서치 에이전트를 구동하는 모델의 추정 파라미터 수보다 훨씬 적은 수치입니다. 해당 모델은 약 305억 개의 전체 파라미터를 가진 Mixture of Experts(전문가 혼합) 구조를 사용하지만, 토큰당 활성화되는 파라미터는 30~33억 개에 불과해 높은 처리량을 유지하면서도 강력한 추론 성능을 보여줍니다.오픈소스 플랫폼인 Hugging Face의 머신러닝 커뮤니티 매니저 Adina Yakefu는 알리바바가 공개한 벤치마크 결과를 “놀랍다”고 평가했습니다. 오픈소스로 출시된 후 이 에이전트는 해당 플랫폼에서 빠르게 인기를 얻으면서 전 세계 개발자들이 다운로드 및 활용할 수 있게 됐습니다.소비자 제품에 통합알리바바는 이미 심층 연구 에이전트를 Amap 내비게이션 애플리케이션에 통합하여 사용자가 최첨단 웹 검색 기능을 통해 장기간 여행 계획을 세우는 데 도움을 주고 있습니다. 이 기술은 알리바바의 법률 연구 도구인 Tongyi FaRui에도 적용되어, 사례법을 검증된 인용과 함께 검색하는 역량을 강화하고 있습니다.더 포괄적인 AI 모델 출시퉁이 딥리서치(Tongyi DeepResearch) 출시는 알리바바의 광범위한 AI 전략의 일부입니다. 지난 2주 간 회사는 800억 개의 파라미터를 탑재했지만 추론 시에는 단 30억 개만 활성화하는 Qwen3-Next-80B-A3B와, 지금까지 회사가 발표한 모델 중 최대 규모인 Qwen3-Max-Preview(1조 파라미터 모델)도 출시했습니다.또한 알리바바는 9월 8일, 수천만 시간의 다국어 오디오로 학습된 자동 음성 인식 모델 Qwen3-ASR-Flash를 출시했으며, 11개 주요 언어와 여러 중국어 방언을 지원합니다.산업 환경 및 경쟁알리바바의 발표 시점은 AI 연구 에이전트 분야에서 전 세계적으로 경쟁이 치열해지고 있는 시기와 맞물려 있습니다. 딥 리서치 에이전트는 여러 단계가 필요한 복잡한 웹 검색 작업을 수행하도록 설계된 고급 AI 도구입니다.OpenAI의 Deep Research는 최초의 이러한 에이전트로, 2025년 2월 ChatGPT에 출시 및 통합되었습니다. Google DeepMind를 포함한 미국의 주요 기술 기업들도 유사한 도구를 선보이고 있습니다.이러한 경쟁은 OpenAI CEO 샘 알트먼이 9월 17일 윈저성에서 열린 국빈 만찬에 다른 기술업계 경영진들과 함께 참석하면서 더욱 두드러졌습니다. 이는 미국 기술 기업과 국제 협력사 간 지속적인 협업을 부각시키는 행사였습니다. 이 이벤트는 핵, AI, 양자 기술 개발에 중점을 둔 420억 달러 규모의 미-영 테크 번영 협정 서명식에 앞서 진행되었습니다.
517 조회
0 추천
2025.09.19 등록
(퍼플렉시티가 정리한 기사)런던에 본사를 둔 스타트업 휴머노이드(Humanoid)는 9월 18일 산업용 애플리케이션을 위해 설계된 영국 최초의 휴머노이드 로봇인 HMND 01 Alpha의 출시를 발표했습니다. 이 바퀴 달린 로봇은 키 220cm에 최대 시속 7.2km로 이동할 수 있으며, 15kg이 넘는 화물을 적재할 수 있습니다. 단 7개월 만에 설립자가 주도한 5천만 달러의 자본으로 개발되었습니다.“로봇은 사람을 대체하는 것이 아니라, 사람을 도와야 합니다,”라고 휴머노이드의 설립자인 아르템 소콜로프(Artem Sokolov)는 말했습니다. “제가 가족의 제조 사업을 확장하면서, 반복적인 작업이 직원들에게 — 제 할아버지, 할머니도 포함해서 — 얼마나 큰 부담이 되는지 직접 보았습니다. HMND 01은 이러한 노동력 부족을 메우기 위해 만들어졌으며, 사람들이 더욱 의미 있는 일에 집중할 수 있도록 돕습니다”.심각한 인력 부족 문제 해결이번 출시는 여러 지역에서 산업계가 심각한 인력난에 직면한 가운데 이뤄졌습니다. 영국만 해도 제조업체들이 58,000개 이상의 공석을 보고하고 있으며, 유럽 전체에서는 26%의 제조업체가 인력 부족을 성장에 대한 핵심 장벽으로 지목하고 있습니다. 미국의 상황은 더욱 심각해 현재 약 60만 개의 일자리가 비어 있으며, 이 수치는 2030년까지 210만 개로 증가할 것으로 예상됩니다.휴머노이드는 HMND 01 Alpha를 처음에는 창고, 물류 허브, 그리고 소매 시설에 배치할 계획이며, 이곳에서 상품의 집기 및 분류, 기계 공급, 키팅, 재고의 상하차 등 반복적이고 육체적으로 힘든 작업을 처리할 수 있습니다.기술과 시장 경쟁HMND 01 Alpha는 29개의 활성 자유도를 갖추고 있으며, AI 기반의 엔드 투 엔드 추론 기능을 통해 작동합니다. 엔드 이펙터는 12 자유도의 오지 손 또는 1 자유도의 평행 그리퍼 중 하나를 장착할 수 있어, 정교한 작업이나 무거운 물체를 다루는 작업에 따라 적응할 수 있습니다. 로봇의 머리에는 360도 RGB 카메라와 두 개의 깊이 센서가 장착되어 있어 포괄적인 인식이 가능합니다.이 스타트업은 테슬라와 엔비디아 등 주요 대기업들이 경쟁을 주도하며, 제조 효율성을 높이기 위해 자율 로봇 기술에 막대한 투자를 하고 있는 점점 더 치열해지는 분야에 합류했습니다. 최근 주요 발전으로는 2025년 8월에 엔비디아가 출시한 Jetson Thor 플랫폼이 있는데, 이 플랫폼은 이전 모델보다 최대 7.5배의 AI 컴퓨팅 능력을 제공하며, Amazon Robotics와 Boston Dynamics를 포함한 초기 사용자들에게 채택되고 있습니다.전략적 개발 경로Humanoid는 창립 첫 해에 이미 두 건의 상업적 개념증명(Proofs of Concept)을 완료하여, HMND 01을 12개월 이내 상업적 배치가 예정된 유일한 산업용 휴머노이드 로봇으로 자리매김했습니다. 회사는 Alpha 버전을 산업 시설 전반에 걸쳐 테스트하여 시장에 적합한 기능과 개선이 필요한 영역에 대한 인사이트를 수집한 뒤, 2026년 3분기에 Beta 버전을 출시할 계획입니다.회사는 로봇-서비스형 비즈니스 모델을 기반으로 운영되고 있으며, Apple, Tesla, Google, Boston Dynamics, Nvidia 등에서 근무한 경력을 가진 175명의 팀원으로 이루어져 있습니다. Humanoid는 380억 달러 규모의 산업 총 잠재시장(총 주소 시장, TAM)에 주목하고 있으며, 이 시장은 2050년까지 1조 달러에 이를 것으로 전망됩니다.
515 조회
0 추천
2025.09.19 등록
(퍼플렉시티가 정리한 기사)Realbotix Corp는 AI 기반 휴머노이드 로봇 “Aria”가 2025년 9월 25일부터 타임스퀘어에서 선보인다고 발표했습니다. 이는 소셜 로보틱스 기술의 주류 채택을 향한 한 걸음을 의미합니다. 다국어를 구사하는 이 로봇은 tm:rw의 첫 독립 매장인 220 W. 42번가에서 브랜드 홍보대사 역할을 하며, 휴머노이드가 연간 1억 명 이상의 보행자와 방문객들을 맞이할 예정입니다.Aria는 산업 작업이 아닌 사회적 상호작용을 위해 설계된 새로운 세대 휴머노이드 로봇을 대표합니다. Realbotix에 따르면, 이 로봇은 영어, 중국어(표준어), 스페인어, 프랑스어, 아랍어, 일본어, 러시아어 등 15개의 주요 언어로 유창하게 소통할 수 있으며, 클라우드 기반 접근을 통해 147개가 넘는 추가 방언까지 지원합니다. 로봇은 생생한 인공 피부와 다양한 표정 구동기가 탑재되어 얼굴 표정과 제스처 표현이 가능합니다.상업용 로봇 시장 확대타임스퀘어 시연은 글로벌 휴머노이드 로봇 시장이 빠르게 성장함에 따라 이루어졌습니다. 업계 전망에 따르면 해당 시장은 2025년 78억 달러에서 2035년 1819억 달러로 확대될 것이며, 이는 연평균 성장률 37%에 해당합니다. 모건스탠리 리서치에 따르면 전체 휴머노이드 시장은 2050년까지 5조 달러에 달할 수 있습니다.Realbotix의 CEO인 Andrew Kiguel은 “타임스퀘어에서 tm:rw와의 협업을 통해 휴머노이드 로봇이 소매업체, 브랜드, 고객에게 실질적인 가치를 제공할 수 있음을 보여준다”고 밝혔습니다. 이번 파트너십을 통해 회사는 세계에서 가장 유동 인구가 많은 소매업 중심지 중 한 곳에서 자사의 기술의 상업적 적용 사례를 선보일 수 있게 되었습니다.tm:rw와의 협업은 Realbotix에게 전략적 쇼케이스 기회를 제공합니다. 혁신적인 소매 콘셉트인 tm:rw는 2025년 7월 타임스퀘어 매장을 오픈했으며, 3개 층에 걸쳐 2만 평방피트 규모로 140개가 넘는 브랜드의 인터랙티브 기술 체험을 선보입니다. tm:rw의 창립자 Nathalie Bernce는 Aria의 도입을 가리켜 “로봇 기술과 일상 생활의 융합에서 하나의 이정표”라고 평가했습니다.기술 및 시장 위치Realbotix는 로봇을 엔터테인먼트, 고객 서비스, 그리고 동반자용으로 판매하며, 흉상 모델은 $10,000부터 전신 휴머노이드 모델은 $175,000까지의 가격대로 제공하고 있습니다. 최근의 변동성에도 불구하고, 회사의 주가는 지난 1년간 276% 상승하며 강력한 실적을 보여주었습니다.이 로봇 회사는 신흥 사회적 AI 분야에서 입지를 다졌으며, 인간-로봇 상호작용 역량에 집중함으로써 산업용 로봇 제조업체들과 차별화하고 있습니다. 최근 배치 사례로는 공항, 병원, 쇼핑몰 등이 있습니다.
482 조회
0 추천
2025.09.19 등록
(퍼플렉시티가 정리한 기사)노션은 목요일, 노션 3.0의 일환으로 AI 에이전트 기능을 공개하며 기본적인 지원에서 자율적인 작업 수행으로의 중요한 발전을 알렸다. 이번 출시는 샌프란시스코에서 열린 회사의 연례 “Make with Notion” 컨퍼런스에서 이뤄졌으며, CEO 아이반 자오는 해당 기술을 “지식 노동을 위한 세계 최초의 AI 에이전트”라고 설명했다.고급 자동화 기능AI 에이전트는 단순히 다음 단계를 제안하는 기존의 AI 도구와는 근본적으로 다른 변화를 보여줍니다. 이 에이전트들은 수백 페이지에 걸쳐 최대 20분 동안 복잡한 다단계 작업을 동시에 수행할 수 있습니다. 또한 페이지를 생성하고 수정하며, 데이터베이스를 관리하고, 구조화된 콘텐츠를 생성하며, Notion 워크스페이스의 여러 구성 요소에 대한 실행 계획을 개발할 수 있습니다.“이제 팀들은 실제로 작업을 완료하는 AI를 준비하고 있습니다.“라고 Notion EMEA의 제너럴 매니저인 Mick Hodgins가 말했습니다. 이 에이전트들은 Slack, Google Drive, Microsoft Teams, SharePoint 등의 외부 플랫폼과 연동되며, 웹 리서치를 통해 포괄적인 정보를 수집할 수 있습니다.사용자들은 프로필 페이지를 통해 에이전트의 행동 선호도, 응답 스타일, 콘텐츠 참조 등을 설정하여 에이전트를 맞춤화할 수 있습니다. 또한 시스템에는 에이전트가 상호작용을 통해 학습하고 자동으로 프로필을 업데이트할 수 있는 메모리 기능이 포함되어 있습니다.생산성 시장에서의 경쟁적 포지셔닝이번 발표는 노션이 생산성 소프트웨어 시장에서 기존 경쟁자인 마이크로소프트와 구글(알파벳 Inc.)에 대해 더욱 공격적인 입장을 취하게 함을 보여줍니다. 마이크로소프트는 2023년에 노션과 유사한 문서 협업 애플리케이션인 루프를 출시했으며, 이는 마이크로소프트 365 가입자가 사용할 수 있게 되었습니다. 한편, 마이크로소프트는 워드 문서와 아웃룩 이메일을 생성할 수 있는 AI 도구인 코파일럿을 홍보하고 있습니다¹.램프, 버셀, 파롤라 등의 기업 고객들은 이미 이 기술을 도입하고 있습니다². 램프의 AI & 운영 책임자인 벤 레빅은 “이제는 몇 시간이나 소요되던 반복 업무가 즉시 사용할 수 있는 시스템으로 바로 구현됩니다. 우리는 이런 노션 에이전트를 활용해 완전히 새로운 업무 흐름을 대규모로 운영하고 있습니다”고 말했습니다.향후 개발 계획Notion은 올해 말에 수동 입력 없이 자동화된 일정이나 트리거에 따라 작동할 수 있는 맞춤형 에이전트의 출시를 계획하고 있습니다. 회사는 이러한 기능을 수백 명의 고객과 함께 테스트하여 사용 패턴을 평가하고, 광범위하게 제공하기 전에 적절한 가격을 결정하고 있습니다.이 에이전트들은 OpenAI와 Anthropic의 시스템을 포함한 다양한 대형 언어 모델을 활용합니다. “우리는 통합하는 모든 LLM이 고객 경험을 향상시키는지 확인하고 싶습니다.“라고 Hodgins는 설명했습니다.현재 에이전트는 웹 브라우저 및 데스크톱 애플리케이션을 통해 기존 Notion AI 구독자에게 즉시 제공되며, 모바일 버전도 곧 출시될 예정입니다.
523 조회
0 추천
2025.09.19 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입