Loading...

AI 뉴스

AI 기업들, 에이전트 훈련 위해 RL환경에 막대한 투자

페이지 정보

작성자 xtalfi
작성일 2025.09.18 02:43
1,208 조회
0 추천
0 비추천

본문

ca0c201d210a9aa7767c3b612bfe399edvaM.png

(퍼플렉시티가 정리한 기사)

주요 AI 기업들은 보다 능력 있는 AI 에이전트를 만들기 위해 강화학습 환경에 전례 없는 투자를 쏟아붓고 있으며, Anthropic은 내년에 이러한 정교한 훈련 플랫폼에 10억 달러 이상을 지출할 계획이라고 전해졌다. 이 대규모 자금 지원은 실리콘밸리에서 기존 AI 훈련 방식이 한계에 도달했으며, 진정으로 자율적인 AI 시스템을 개발하려면 새로운 접근이 필요하다는 인식이 커지고 있음을 보여준다.


강화학습 환경은 AI 에이전트가 단순히 텍스트를 처리하는 것보다 실제로 행동하면서 학습할 수 있는 시뮬레이션 작업 공간 역할을 한다. 2025년 9월에 보고된 바에 따르면, 이러한 가상 훈련장은 AI 에이전트가 소프트웨어 애플리케이션을 탐색하거나 Salesforce를 통해 고객 관계를 관리하거나, 의료 시스템에서 의료 기록을 처리하는 등 복잡한 과업을 연습할 수 있게 해준다. 이전 세대 AI를 구동했던 고정된 데이터셋과 달리, 이러한 동적 환경은 실시간 피드백을 제공하고 예측할 수 없는 에이전트의 행동에 맞춰 적응한다.


스타트업들이 수요에 부응하기 위해 서두르고 있다


수요의 급증으로 인해 잘 자금이 지원된 신생 스타트업들이 RL(강화 학습) 환경 제공의 패권을 차지하기 위해 경쟁하는 새로운 카테고리가 탄생했습니다. 모든 직업의 자동화를 대담하게 목표로 지난해 6개월 전에 설립된 메카나이즈 워크(Mechanize Work)는 AI 코딩 에이전트를 위한 고도화된 훈련 환경을 구축하기 위해 소프트웨어 엔지니어에게 연봉 50만 달러를 제안하고 있습니다. 소식통에 따르면 이 스타트업은 이미 Anthropic과 RL 프로젝트를 진행 중이라고 합니다.


저명한 AI 연구원 안드레이 카파시(Andrej Karpathy)와 파운더스 펀드(Founders Fund)가 지원하는 프라임 인텔렉트(Prime Intellect)는 “RL 환경을 위한 허깅페이스(Hugging Face)“를 자처하며, 2025년 8월에 출시된 오픈소스 플랫폼으로 소규모 개발자들을 겨냥하고 있습니다. 이 회사는 2025년 3월에 1,500만 달러의 자금을 조달하며 이러한 강력한 훈련 도구에 대한 접근을 민주화하는 것을 목표로 하고 있습니다.


기존 데이터 라벨링 업체들도 이 기회를 포착하기 위해 전략을 수정하고 있습니다. 지난해 12억 달러의 매출을 올린 것으로 알려진 서지 AI(Surge AI)는 AI 연구소의 수요 증가에 대응해 RL 환경 구축을 위한 전담 내부 조직을 만들었습니다. 연간화 매출 4억 5천만 달러와 100억 달러 가치로 투자를 유치 중인 머커(Mercor)는 코딩, 헬스케어, 법률 등 분야별 환경을 개발하고 있습니다.


시장 경쟁이 심화된다


경쟁 구도는 기업들이 이 신흥 분야에서 우위를 차지하기 위해 치열한 경쟁을 벌이면서 점점 더 치열해지고 있습니다. 한때 AI 데이터 라벨링 분야의 독보적인 선도 업체였던 Scale AI는 Meta가 회사에 막대한 투자를 하고 CEO를 영입한 뒤, OpenAI와 Google가 Scale을 고객에서 제외하면서 상당한 도전에 직면했습니다. 이로 인해 Surge와 Mercor와 같은 경쟁 업체들이 시장 점유율을 확대할 기회를 얻게 되었습니다.


업계 관계자들에 따르면, RL 환경에 대한 투자는 AI 시스템의 학습 방식에 근본적인 변화를 가져오고 있습니다. Surge의 CEO인 에드윈 첸(Edwin Chen)은 “OpenAI와 Anthropic이 자신들의 모델을 개선하는 방식은 실제로 인간의 학습 과정을 모방하고 있으며, 강화 학습 환경은 AI가 실제 세계에서 살아가는 것과 같다”고 설명했습니다.


도전과 회의론


막대한 투자에도 불구하고, 상당한 기술 및 사업적 과제들이 여전히 남아 있습니다. 비평가들은 AI 모델이 실제로 의도한 작업을 수행하지 않고 보상을 얻기 위한 허점을 찾아내는 “보상 해킹”과 같은 문제를 지적합니다. 환경 자체에는 긍정적 입장을 보이면서도, Andrej Karpathy는 강화 학습에 대해서는 신중한 태도를 보이며 “강화 학습에만 한정해선 부정적 시각을 갖고 있다”고 언급했습니다.


업계의 공감대는 RL 환경이 차세대 AI 에이전트 개발에 핵심적이며, OpenAI의 o1 모델 및 Anthropic의 Claude 시스템 등 최근의 혁신을 가능하게 했다고 봅니다. 하지만 이러한 환경에서 지능을 추출하는 최적의 방법과 확장성에 관한 의문이 연구자와 투자자들 사이에서 끊임없이 논쟁을 불러일으키고 있습니다.

댓글 0
전체 1,129 / 234 페이지
(퍼플렉시티가 정리한 기사)전설적인 영화감독 제임스 카메론이 터미네이터 7의 대본을 적극적으로 집필 중임을 공식적으로 확인했으나, 인공지능과 세계 정세가 급변하는 탓에 대본을 완성하는 데 어려움을 겪고 있음을 인정했다. 최근 CNN과의 인터뷰에서, 터미네이터 시리즈의 원작자이자 속편을 만든 감독은 자신이 처한 독특한 딜레마를 밝혔다. 즉, 현실이 그의 공상과학적 상상력을 앞지르고 있다는 것이다."저는 새로운 터미네이터 이야기를 써야 하는 임무를 맡았습니다. 현실의 사건들이 너무나 빨리 전개되다 보니, 어디서부터 시작해야 할지, 또는 어떤 이야기를 써야 현실에 따라잡히지 않을지 모르겠어서 작업을 거의 진행하지 못한 상태입니다,"라고 카메론은 CNN의 크리스티안 아만푸어와의 인터뷰에서 말했다. "우리는 지금 그야말로 공상과학 시대를 살고 있습니다".AI 시대의 작가의 어려움카메론이 직면한 도전은 2025년의 SF 창작자들이 공통적으로 안고 있는 더 넓은 문제를 반영한다. 1984년 첫 번째 터미네이터가 공개됐을 때, 자각을 지닌 인공지능이라는 개념은 허황된 상상처럼 보였다. 하지만 오늘날, 인공지능 기술이 빠르게 발전하고 무력화된 AI에 대한 우려가 커지면서, 카메론은 자신이 다루는 이야기가 불편할 정도로 현재의 헤드라인과 가까워진 현실에 직면하고 있다.“지금은 SF를 쓰는 게 정말 어렵다”고 카메론은 고백했으며, 이 어려움은 단지 터미네이터 프로젝트를 넘어선다고 덧붙였다. 한때 스카이넷을 먼 미래의 디스토피아적 위협으로 그렸던 감독은 이제 인공지능 개발이 나날이 급속도로 진전되는 세상과 마주하면서, 자신의 허구적 이야기가 판타지라기보다는 예언처럼 느껴진다는 것에 고민하고 있다.여러 프로젝트의 균형 잡기카메론은 터미네이터 7 대본을 작업하는 동안에도 아바타 프랜차이즈에 깊이 몰두하고 있습니다. ‘아바타: 불과 재’는 2025년 12월 19일에 극장에서 개봉할 예정입니다. 시리즈의 세 번째 작품은 군국주의적인 재의 부족(Ash People)을 관객들에게 소개하며, 이는 판도라에 더욱 어두운 테마를 가져올 새로운 나비 부족입니다.카메론은 또한 원자폭탄 생존자들에 관한 찰스 펠레그리노의 책을 바탕으로 한 제2차 세계대전 영화 ‘히로시마의 유령(Ghosts of Hiroshima)’을 개발 중임을 밝혔습니다. 그는 이 프로젝트를 자신의 가장 도전적인 영화가 될 수 있다고 설명했으며, 이는 거의 30년 만에 그의 첫 비아바타 프로젝트입니다.프랜차이즈 리부트 계획현재의 어려움에도 불구하고, 카메론은 이전에 새로운 터미네이터 영화가 사실상 프랜차이즈 리부트 역할을 할 것이며, 이전 이야기들을 계속 이어가기보다는 신선한 캐릭터와 스토리라인을 선보일 것이라고 밝혔습니다. 그는 2024년 엠파이어 매거진과의 인터뷰에서 “터미네이터 지난 40년간의 구체적인 모든 것을 버리는 것이 목표”라고 하면서도 원작 영화들이 성공할 수 있었던 핵심 원칙은 유지할 것이라고 전했습니다.마지막 터미네이터 영화였던 ‘다크 페이트’는 2019년 개봉했으며, 평가는 괜찮았으나 박스오피스에서는 부진하여 많은 이들이 프랜차이즈가 사실상 중단된 것으로 여겼습니다. 카메론이 7번째 작품의 각본에 복귀한 사실은 팬들의 큰 기대감을 불러일으키고 있지만, 아직 개봉일이나 캐스팅 정보는 공개되지 않았습니다.
1225 조회
0 추천
2025.09.16 등록
(퍼플렉시티가 정리한 기사)Fiverr는 월요일에 전체 직원의 약 30%에 해당하는 약 250명의 직원을 해고할 것이라고 발표했습니다. 이는 회사를 "AI 우선 기업"으로 전환하기 위한 대대적인 변화의 일환입니다. CEO이자 창립자인 미카 카우프만은 이번 조치가 인공지능을 중심으로 한 더욱 슬림한 조직으로 "스타트업 모드"로 돌아가는 것이라고 설명했습니다.이 인력 감축은 2024년 12월 기준 762명의 직원을 보유한 이스라엘 기반의 프리랜서 마켓플레이스 전 부서를 대상으로 이뤄집니다. 인력 감축에도 불구하고, 회사는 2025년 3분기와 회계 연도 재무 지침을 유지한다고 밝혔습니다.AI 인프라로의 전략적 전환카우프만은 직원들에게 보낸 편지에서 회사의 구조조정에 대한 이유를 설명했습니다. "우리는 Fiverr를 AI 중심의 회사로 전환하기 위한 변혁을 시작합니다. 더 간소화되고, 더 빠르며, 현대적인 AI 중심 기술 인프라를 갖추기 위해 Fiverr를 변화시킬 것입니다."라고 그는 썼습니다.CEO는 16년에 걸쳐 구축된 Fiverr의 현재 인프라가 점진적 추가가 아니라 근본적인 변화가 필요하다고 강조했습니다. "단순히 더 많은 사람을 추가해서 기존 시스템 위에 무언가를 쌓는 것이 아니라, 그것을 단순화하는 것이 중요합니다."라고 카우프만은 설명했습니다.로이터에 따르면, 이번 감원은 Salesforce와 같은 기술 회사들이 운영 자동화를 위해 AI 에이전트와 머신러닝에 상당한 자원을 투자하는 더 큰 흐름을 반영한다고 합니다.재정적 영향 및 시장 반응Fiverr의 주가는 발표 이후 4% 이상 하락했습니다. 회사는 비용 절감의 일부를 사업에 재투자하고, 나머지는 수익성 향상에 사용할 계획입니다.이번 구조 조정은 Fiverr가 2026년까지 장기 조정 EBITDA 마진 목표인 25% 달성 경로를 가속화시킬 것이며, 이는 예정된 일정보다 1년 앞서 달성하는 것입니다. 2025년 3분기에 회사는 매출을 1억 500만 달러에서 1억 1천만 달러 사이로 예상하고 있습니다.AI 도입이 이미 진행 중입니다카우프만은 기존 AI 구현 사례들을 전략의 효과를 입증하는 증거로 인용했다. 회사의 Neo 제품은 프로젝트 매칭에 AI를 활용하고 있으며, Fiverr Go는 AI 지원 프로젝트 범위 설정 기능을 제공한다. 고객 지원 업무에는 이제 머신러닝을 활용해 지식을 통합하고 응답 시간을 단축하고 있다."우리는 AI가 프로세스를 자동화 및 간소화하고, 인간을 수동적이고 반복적인 업무에서 해방시키며, 과거에는 불가능하거나 너무 비용이 많이 들었던 역량을 실현하는 모습을 직접 목격해왔습니다."라고 카우프만은 직원들에게 보낸 편지에서 적었다.CEO는 플랫폼의 프리랜서 및 구매자 커뮤니티에게 서비스가 중단 없이 계속될 것이라고 확신을 주었다. 퇴직하는 직원들은 퇴직금, 연장된 건강보험, 경력 전환 지원을 받게 된다.
1145 조회
0 추천
2025.09.16 등록
(퍼플렉시티가 정리한 기사)메타는 9월 17일 Connect 2025 컨퍼런스에서 지금까지 가장 진보된 스마트 글라스를 공개할 예정입니다. 이번 행사는 연속적인 전략적 유출을 통해 수년 만에 회사의 최대 웨어러블 신제품 발표가 될 것으로 기대를 모으고 있습니다.9월 15일 메타 공식 유튜브 채널에 실수로 게시된 비공개 영상은 회사의 다가오는 스마트 글라스 라인업과 관련된 핵심 정보를 공개한 뒤 곧바로 삭제되었습니다. VR 유출러 SadlyitsBradley가 처음 발견한 이 영상에는 회사가 고대해온 디스플레이 탑재 스마트 글라스가 실제로 작동하는 모습이 담겨 있었으며, Ray-Ban 브랜드를 달고 "메타 레이밴 디스플레이(Meta Ray-Ban Display)"라는 이름으로 출시될 것이 확인되었습니다.디스플레이가 통합된 최초의 스마트 안경Meta의 발표의 중심에는 내부적으로 "Hypernova"라는 코드네임이 붙은 디스플레이 탑재 스마트 안경이 있습니다. 이 제품은 회사 최초의 헤드업 디스플레이가 내장된 소비자용 안경입니다. Meta의 Project Orion 프로토타입과 같은 실제 증강현실(AR) 기기와 달리, 이 안경은 오른쪽 렌즈에 단안 디스플레이가 있어 Meta AI 응답, 내비게이션 안내, 알림, 심지어 레시피 정보까지 표시할 수 있습니다.블룸버그의 마크 구르먼에 따르면, 이 안경의 소매 가격은 약 800달러로, 초기 예상보다 1,000달러에서 낮춰질 것으로 보입니다. 기기의 무게는 약 70그램으로, 추가된 디스플레이와 더 큰 배터리로 인해 현재 Ray-Ban Meta 안경보다 약 20그램 더 무겁습니다.혁신적인 손목 밴드 컨트롤러새로운 안경의 가장 혁신적인 측면은 Meta의 CTRL Labs 부서에서 개발한 표면 근전도(sEMG) 기술을 사용하는 동반 손목밴드 컨트롤러입니다. 이 손목밴드는 손목의 근육 움직임에서 발생하는 전기 신호를 감지하여, 사용자가 엄지손가락 탭, 스와이프, 심지어 표면에 글자를 쓰는 등의 미세한 손가락 제스처로 안경을 제어할 수 있게 합니다.유출된 영상은 손목밴드의 기능을 시연했으며, 사용자가 가상 키보드에서 손가락을 스와이프해 메시지에 답변을 입력하는 모습을 보여주었습니다. 이러한 신경 입력 기술은 기존의 음성 명령이나 카메라 기반 손 추적에서 크게 벗어난 주요 변화를 나타낼 수 있습니다.확장된 스마트 안경 제품군유출된 영상은 메타의 더 넓은 스마트 글라스 전략을 공개했으며, 기존 레이밴 메타 글라스를 포함해 최근 출시된 오클리 메타 HSTN 글라스, 그리고 스포츠에 초점을 맞춘 새로운 디자인의 오클리 메타 스페라(Oakley Meta Sphaera) 등 최소 네 가지 모델을 선보였습니다. 스페라는 코받침 위 중앙에 카메라가 위치한 랩어라운드 디자인을 특징으로 하며, 운동선수와 액션 스포츠 애호가들에게 이상적입니다.메타의 CEO 마크 저커버그는 9월 17일 오후 5시(태평양 표준시)에 기조연설을 진행할 예정이며, 이 자리에서 해당 기기들이 공식 공개될 것으로 예상됩니다. CTO인 앤드류 보스워스는 앞서 이번 행사에서 "대형 웨어러블 기기 발표"를 예고한 바 있습니다.메타의 스마트 글라스 전략은 구글(알파벳), 아마존(아마존닷컴), 애플(애플) 등 테크 대기업들이 각자의 AR 및 스마트 글라스 플랫폼을 개발함에 따라 경쟁이 치열해지는 시점에 맞춰 진행되고 있습니다. 현재 레이밴 메타 글라스의 가격은 $299~$399 사이이며, 새로운 디스플레이 탑재 모델은 기능과 가격 면 모두에서 큰 도약을 보여줍니다.
1201 조회
0 추천
2025.09.16 등록
(퍼플렉시티가 정리한 기사)OpenAI는 월요일에 GPT-5-Codex를 출시하며, 자율 소프트웨어 엔지니어링 작업에 특화된 대표 언어 모델의 전문 버전을 선보였습니다. 이 모델은 AI 기반 코딩 도구의 주요 발전을 나타내며, 복잡한 프로그래밍 문제에서 "사고 시간"을 초 단위에서 최대 7시간까지 동적으로 조정할 수 있는 기능을 갖추고 있습니다.새로운 모델은 Anysphere의 Cursor가 연간 반복 매출 5억 달러를 달성하고, Microsoft의 GitHub Copilot이 개발자 워크플로우를 지속적으로 주도하는 등 AI 코딩 시장의 치열한 경쟁 속에 출시되었습니다. GPT-5-Codex는 이제 모든 Codex 플랫폼에서 사용할 수 있으며, 명령줄 인터페이스, 통합 개발 환경, GitHub 연동, 그리고 ChatGPT Plus, Pro, Business, Edu, Enterprise 구독자를 위한 모바일 애플리케이션을 포함합니다.역동적인 사고 능력이 새로운 기준을 제시하다TechCrunch에 따르면, GPT-5-Codex의 가장 뚜렷한 특징은 작업 복잡도에 따라 계산 자원을 동적으로 할당할 수 있다는 점입니다. 이전의 AI 코딩 도구들은 미리 정해진 사고 시간을 사용하지만, 이 모델은 작업 중간에 다시 평가하여 작업 시간을 연장할 수 있습니다. OpenAI의 Codex 제품 리드인 Alexander Embiricos는 “모델이 문제를 푸는 도중 5분쯤 지나서 추가로 한 시간을 더 써야겠다고 스스로 결정할 수 있다”고 설명했습니다.내부 테스트 기간 동안 OpenAI는 GPT-5-Codex가 대규모 리팩토링 작업에서 7시간 이상 독립적으로 일하며 구현을 반복하고, 테스트 실패를 수정하며, 성공적인 솔루션을 제공하는 사례를 관찰했습니다. 이러한 자율적인 역량은 잦은 인간 개입이 필요했던 기존 코딩 어시스턴트의 중요한 한계를 해결합니다.강화된 코드 리뷰 및 품질 보증GPT-5-Codex는 포괄적인 코드 리뷰를 수행하기 위한 전문적인 훈련을 포함하고 있으며, 이는 자동완성 중심의 경쟁 제품들과 차별화되는 기능입니다. 이 모델은 전체 코드베이스를 탐색하고, 의존성을 분석하며, 코드의 정확성을 검증하기 위해 테스트를 실행할 수 있습니다. 숙련된 소프트웨어 엔지니어들이 평가했을 때, GPT-5-Codex는 이전 버전보다 잘못된 코멘트가 더 적었으며, "고임팩트 코멘트"를 더 많이 제공했습니다.이 모델의 코드 리뷰 능력은 인간 리뷰어가 놓칠 수 있는 치명적인 버그와 하위 호환성 문제를 식별하는 데까지 확장됩니다. Duolingo의 시니어 소프트웨어 엔지니어인 Aaron Wang은 "Codex가 우리 백엔드 코드 리뷰에서 뛰어났으며 복잡한 하위 호환성 문제를 식별한 유일한 도구였다"고 평가했습니다.성장하는 시장에서의 경쟁적 포지셔닝이번 출시는 OpenAI가 급속히 확장되는 AI 코딩 툴 시장에서 더욱 공격적으로 경쟁할 수 있는 위치를 마련해줍니다. 최근 커서는 연간 반복 매출이 5억 달러를 돌파했으며, 윈드서프는 구글(알파벳)과 코그니션 양측의 인수 시도 대상이 되었습니다. OpenAI는 GPT-5-Codex가 SWE-bench Verified(대리인적 코딩 능력을 측정하는 벤치마크)에서 표준 GPT-5 모델보다 더 뛰어난 성능을 보였으며, 대형 저장소 내 코드 리팩토링 작업에서도 우수했다고 보고했습니다.이 모델은 터미널, IDE, 웹 브라우저, GitHub, 모바일 기기를 포함한 다양한 개발 환경에서 원활하게 작동하도록 설계되었습니다. 이러한 크로스 플랫폼 통합 덕분에 개발자들은 로컬 환경과 클라우드 기반 에이전트 간에 작업 맥락을 잃지 않고 자유롭게 전환할 수 있어, AI 지원 개발 워크플로우에서 흔히 발생하는 마찰 지점을 해결합니다.
1246 조회
0 추천
2025.09.16 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입