Loading...

AI 뉴스

AI 기업들, 에이전트 훈련 위해 RL환경에 막대한 투자

페이지 정보

작성자 xtalfi
작성일 2025.09.18 02:43
1,382 조회
0 추천
0 비추천

본문

ca0c201d210a9aa7767c3b612bfe399edvaM.png

(퍼플렉시티가 정리한 기사)

주요 AI 기업들은 보다 능력 있는 AI 에이전트를 만들기 위해 강화학습 환경에 전례 없는 투자를 쏟아붓고 있으며, Anthropic은 내년에 이러한 정교한 훈련 플랫폼에 10억 달러 이상을 지출할 계획이라고 전해졌다. 이 대규모 자금 지원은 실리콘밸리에서 기존 AI 훈련 방식이 한계에 도달했으며, 진정으로 자율적인 AI 시스템을 개발하려면 새로운 접근이 필요하다는 인식이 커지고 있음을 보여준다.


강화학습 환경은 AI 에이전트가 단순히 텍스트를 처리하는 것보다 실제로 행동하면서 학습할 수 있는 시뮬레이션 작업 공간 역할을 한다. 2025년 9월에 보고된 바에 따르면, 이러한 가상 훈련장은 AI 에이전트가 소프트웨어 애플리케이션을 탐색하거나 Salesforce를 통해 고객 관계를 관리하거나, 의료 시스템에서 의료 기록을 처리하는 등 복잡한 과업을 연습할 수 있게 해준다. 이전 세대 AI를 구동했던 고정된 데이터셋과 달리, 이러한 동적 환경은 실시간 피드백을 제공하고 예측할 수 없는 에이전트의 행동에 맞춰 적응한다.


스타트업들이 수요에 부응하기 위해 서두르고 있다


수요의 급증으로 인해 잘 자금이 지원된 신생 스타트업들이 RL(강화 학습) 환경 제공의 패권을 차지하기 위해 경쟁하는 새로운 카테고리가 탄생했습니다. 모든 직업의 자동화를 대담하게 목표로 지난해 6개월 전에 설립된 메카나이즈 워크(Mechanize Work)는 AI 코딩 에이전트를 위한 고도화된 훈련 환경을 구축하기 위해 소프트웨어 엔지니어에게 연봉 50만 달러를 제안하고 있습니다. 소식통에 따르면 이 스타트업은 이미 Anthropic과 RL 프로젝트를 진행 중이라고 합니다.


저명한 AI 연구원 안드레이 카파시(Andrej Karpathy)와 파운더스 펀드(Founders Fund)가 지원하는 프라임 인텔렉트(Prime Intellect)는 “RL 환경을 위한 허깅페이스(Hugging Face)“를 자처하며, 2025년 8월에 출시된 오픈소스 플랫폼으로 소규모 개발자들을 겨냥하고 있습니다. 이 회사는 2025년 3월에 1,500만 달러의 자금을 조달하며 이러한 강력한 훈련 도구에 대한 접근을 민주화하는 것을 목표로 하고 있습니다.


기존 데이터 라벨링 업체들도 이 기회를 포착하기 위해 전략을 수정하고 있습니다. 지난해 12억 달러의 매출을 올린 것으로 알려진 서지 AI(Surge AI)는 AI 연구소의 수요 증가에 대응해 RL 환경 구축을 위한 전담 내부 조직을 만들었습니다. 연간화 매출 4억 5천만 달러와 100억 달러 가치로 투자를 유치 중인 머커(Mercor)는 코딩, 헬스케어, 법률 등 분야별 환경을 개발하고 있습니다.


시장 경쟁이 심화된다


경쟁 구도는 기업들이 이 신흥 분야에서 우위를 차지하기 위해 치열한 경쟁을 벌이면서 점점 더 치열해지고 있습니다. 한때 AI 데이터 라벨링 분야의 독보적인 선도 업체였던 Scale AI는 Meta가 회사에 막대한 투자를 하고 CEO를 영입한 뒤, OpenAI와 Google가 Scale을 고객에서 제외하면서 상당한 도전에 직면했습니다. 이로 인해 Surge와 Mercor와 같은 경쟁 업체들이 시장 점유율을 확대할 기회를 얻게 되었습니다.


업계 관계자들에 따르면, RL 환경에 대한 투자는 AI 시스템의 학습 방식에 근본적인 변화를 가져오고 있습니다. Surge의 CEO인 에드윈 첸(Edwin Chen)은 “OpenAI와 Anthropic이 자신들의 모델을 개선하는 방식은 실제로 인간의 학습 과정을 모방하고 있으며, 강화 학습 환경은 AI가 실제 세계에서 살아가는 것과 같다”고 설명했습니다.


도전과 회의론


막대한 투자에도 불구하고, 상당한 기술 및 사업적 과제들이 여전히 남아 있습니다. 비평가들은 AI 모델이 실제로 의도한 작업을 수행하지 않고 보상을 얻기 위한 허점을 찾아내는 “보상 해킹”과 같은 문제를 지적합니다. 환경 자체에는 긍정적 입장을 보이면서도, Andrej Karpathy는 강화 학습에 대해서는 신중한 태도를 보이며 “강화 학습에만 한정해선 부정적 시각을 갖고 있다”고 언급했습니다.


업계의 공감대는 RL 환경이 차세대 AI 에이전트 개발에 핵심적이며, OpenAI의 o1 모델 및 Anthropic의 Claude 시스템 등 최근의 혁신을 가능하게 했다고 봅니다. 하지만 이러한 환경에서 지능을 추출하는 최적의 방법과 확장성에 관한 의문이 연구자와 투자자들 사이에서 끊임없이 논쟁을 불러일으키고 있습니다.

댓글 0
전체 1,181 / 253 페이지
(퍼플렉시티가 정리한 기사)Reddit는 대형 인터넷 퍼블리셔 연합에 합류해 콘텐츠 제작자가 인공지능 기업이 그들의 작업물을 수집할 때 보상을 받을 수 있도록 돕는 새로운 오픈 소스 프로토콜인 Really Simple Licensing(RSL)을 지원하게 되었습니다. 2025년 9월 10일에 발표된 이번 소식으로 Reddit은 Yahoo, Medium, Quora 등 여러 퍼블리셔들과 함께 업계 관계자들이 인터넷 규모에서 AI 데이터 라이선싱에 대한 첫 번째 표준화된 접근 방식이라고 설명하는 움직임에 동참하게 되었습니다.법적 분쟁 속에서 새로운 기준이 등장하다AI 기업들이 저작권 문제에 직면하고 있는 가운데 RSL 이니셔티브가 등장했습니다. 최근 Anthropic은 자사의 AI 모델을 훈련시키는 데 불법 복제된 책을 사용했다고 주장한 작가들이 제기한 집단 소송을 해결하기 위해 15억 달러를 지불하기로 합의했습니다. 이 합의는 법원의 승인을 기다리고 있으며, Anthropic이 약 50만 권의 저작물에 대해 권당 약 3,000달러를 지급하고 모든 불법 데이터셋을 파기하도록 요구합니다.이 시기는 AI 기업들이 합법적인 라이선스 체계를 마련해야 한다는 압박이 증가하고 있음을 보여줍니다. Reddit CEO인 Steve Huffman은 RSL 표준이 "AI 시대에 퍼블리셔와 플랫폼이 명확하고 확장 가능한 방식으로 라이선스 조건을 설정할 수 있게 해준다"고 강조했습니다. Reddit은 2025년 6월에 사용자 게시물의 무단 스크래핑을 주장하며 Anthropic을 상대로 소송을 제기한 바 있습니다.기술적 프레임워크 및 집행의 과제공동 개발자 에크하르트 발터(Eckart Walther)와 전 Ask.com CEO 더그 리즈(Doug Leeds)가 널리 채택된 RSS 표준을 기반으로 구축한 RSL은 발행인이 로봇.txt 파일에 기계가 읽을 수 있는 라이선스 조건을 직접 임베드할 수 있게 해줍니다. 이 프로토콜은 구독료, 크롤링당 요금, AI 시스템이 답변에 콘텐츠를 참조할 때의 추론별 보상 등 다양한 결제 모델을 지원합니다.하지만 표준의 효과는 전적으로 AI 기업의 자발적 준수에 달려 있습니다. 주요 AI 기업들 중 어느 곳도 RSL 조건을 준수하겠다고 약속하지 않았으며, 이는 이전에도 기업들이 자주 무시했던 robots.txt 지침과 비슷한 문제를 떠올리게 합니다. RSL 콜렉티브는 콘텐츠 전달 네트워크인 Fastly와 협력하여 기술적 집행을 제공하고 있으며, 이는 리즈가 "입구의 경호원"이라고 묘사한 역할을 수행합니다.업계 연합, 집단 교섭력 모색비영리 단체인 RSL Collective는 ASCAP와 BMI와 같은 음악 산업 조직의 성공을 본떠, 퍼블리셔들의 권리를 모아 더 강력한 협상력을 확보하는 것을 목표로 한다. 참여 기업에는 인터넷 베테랑인 Yahoo, Reddit, Medium뿐 아니라 Quora와 Ziff Davis(이 회사는 CNET과 Mashable을 소유)를 포함한 새로운 플랫폼 및 콘텐츠 네트워크도 있다.이 연합은 개별 라이선스 계약에서 집단적 행동으로의 전략적 변화를 나타낸다. Reddit은 이미 Google(알파벳 Inc.) 및 OpenAI와 연 6천만 달러 규모의 별도 계약을 체결했지만, RSL을 더 포괄적이고 실제 사용 패턴을 더 잘 반영할 수 있는 해법이라며 지지한다.업계의 지지에도 불구하고, 이 표준은 AI 기업들의 채택 없이는 미래가 불확실하며, 자발적 준수보다는 주로 법적 분쟁과 기술적 제약에 집행이 의존하게 된다.
1451 조회
0 추천
2025.09.12 등록
제목 AI 이미지 업스케일은 실제 사실을 보여주지 않는다최근 소셜미디어에서는 도널드 트럼프 대통령의 건강 악화설과 관련된 AI 이미지 업스케일 사진이 확산되었다. AI로 이미지를 '보정'하면 진짜 모습을 확인할 수 있을 것처럼 보이지만, 실제로는 원본에 없던 내용이 추가되어 잘못된 정보를 만들어 낸 것이다.예를 들어, 트럼프의 이마에 이상한 덩어리가 보인다는 의혹이 돌았으나, 이는 AI가 어두운 그림자나 주름을 임의로 해석해서 만들어낸 가짜 정보였다. 사람들은 이 이미지를 보고 '뇌수술 흔적'이라거나 구체적 진단을 내리기도 했지만, 모두 사실이 아니다이처럼 AI 이미지 보정이나 업스케일 도구는 실제 정보를 알려주기보다는, 픽셀의 패턴을 임의로 채워서 그럴듯하게 보이게 만들 뿐이다. 그래서 이미지를 검사하는 또 다른 AI(Grok 등)도 진위를 제대로 판별하지 못하는 사례가 많았다2022년 오스카 시상식에서 윌 스미스가 크리스 록을 뺨 때린 영상을 AI로 보정했더니, 록의 얼굴에 이상한 보호구가 있다고 오해하는 등 새로운 음모론을 낳았다. 이는 원본 이미지의 그림자나 주름을 AI가 과도하게 강조해 실제로 없는 내용을 덧입힌 결과였다.AI 업스케일 도구는 게임이나 픽션 장면 등을 선명하게 만드는 데는 활용 가치가 있지만, 역사적 영상이나 뉴스 이미지를 보정하여 '진실'을 밝히려는 시도에는 한계가 명확하다. 가짜 정보가 주로 퍼질 수 있으므로, 현실을 판단할 때 AI 보정 이미지를 신뢰해서는 안 된다.https://gizmodo.com/ai-zoom-enhance-does-not-work-2000651736
1475 조회
0 추천
2025.09.12 등록
컬리가 인공지능(AI) 식단 관리 앱 루션’(Roution)을 공식 출시했다. 루션은 음식 사진·이름 입력을 통한 식단 기록과 개인 맞춤형 식단 추천 기능을 제공하며, 컬리 최초로 구글 생성형 AI를 핵심 로직에 적용했다. 이용자의 나이, 성별, 체중, 활동량, 알레르기, 목표 칼로리 등을 반영해 하루 권장 섭취량과 영양 비율을 고려한 맞춤형 식단을 설계한다. 앱은 컬리 상품과 연동돼 추천 식단을 바로 구매할 수 있고, 식단 관리 미션 완료 시 포인트를 적립해 할인 쿠폰·교환권으로 활용할 수 있다. 현재는 주로 **다이어트 목적**으로 쓰이고 있으며, 컬리 계정을 통해서만 가입 가능하다. 컬리는 앞으로 루션을 체중, 체지방, 혈당, 수면 등 주요 건강 지표를 통합 모니터링하는 맞춤형 건강 관리 플랫폼으로 확장할 계획이다.
1482 조회
0 추천
2025.09.11 등록
(퍼플렉시티가 정리한 기사)Airbnb CEO 브라이언 체스키는 인공지능으로 인해 일자리를 잃은 근로자들에게 자사의 기업이 잠재적인 생명줄이 될 수 있다는 인상적인 비전을 제시하며, 플랫폼의 확장되는 서비스가 일자리 자동화에 대한 두려움이 커지는 시대의 피난처가 될 수 있다고 강조했습니다.화요일 샌프란시스코에서 열린 골드만삭스 Communacopia + Technology Conference에서 체스키는 환대 및 서비스 중심의 역할은 AI의 교란에 대해 탄력적으로 남을 것이라고 주장하며, 자신의 플랫폼이 자동화에 취약한 산업에서 근로자들을 흡수할 수 있음을 시사했습니다.인간적인 손길은 여전히 필수적입니다체스키의 낙관주의는 특정 경험에는 대체할 수 없는 인간적인 요소가 필요하다는 그의 신념에서 비롯된다. "저는 사람들이 보르도에 가서 와인 한 병을 마실 때, 그 경험이 AI로 이뤄지기를 원하지 않는다고 생각합니다,"라고 그는 설명했다. "그들이 코모 호수에 갈 때, 누군가가 문을 로봇이 열어주는 것을 원하지 않을 것이라고 생각해요".이러한 관점은 현재의 자동화 트렌드와는 크게 대조된다. 체스키는 자율주행 차량이 결국 인간 운전자를 없애게 될 것임을 인정하면서—"미래에는 인간이 운전하는 차량이 거의 없을 것 같아요"—향후 5~10년 동안은 환대 서비스(호스피탈리티)가 사람 중심으로 이루어질 것이라고 강조했다.최근 데이터는 라이드셰어 운전사들에 대한 그의 우려를 뒷받침한다. 2025년 9월 Gridwise의 보고서에 따르면, 로보택시가 활성화된 모든 시장에서 라이드셰어 운전자의 시간당 급여가 하락했으며, 샌프란시스코는 6.9%, 오스틴은 5.3%의 하락을 기록했다.에어비앤비의 확장하는 생태계이 회사는 단순한 임대 플랫폼에서 체스키가 말하는 '올인원 앱'으로 탈바꿈해왔으며, 개인 셰프, 마사지, 사진 촬영 등과 같은 서비스로 영역을 확장하고 있습니다. 이러한 다양화는 2025년 5월에 검증된 전문가들이 평균 10년 이상의 경력을 가진 Airbnb 서비스와 함께 시작되었습니다."만약 AI가 많은 일자리를 대체하게 된다면, 그 중 일부라도 우리 플랫폼에서 성장하고 확대될 수 있기를 바랍니다,"라고 체스키는 컨퍼런스에서 밝혔습니다.AI로 인한 일자리 대체 현실체스키의 비전은 인공지능(AI)으로 인한 일자리 상실 경고가 점점 커지는 상황에서 등장했다. Anthropic의 CEO 다리오 아모데이는 최근 AI가 향후 5년 내에 모든 초급 화이트칼라 일자리의 절반을 사라지게 할 수 있으며, 실업률이 10~20%에 이를 수 있다고 예측했다.'AI의 대부'로 불리는 제프리 힌턴 역시 "평범한 지적 노동"이 대체될 위험이 있다고 경고하면서, 배관과 같은 육체적 직업이 더 안전한 선택일 수 있음을 시사했다. 최근 자료에 따르면 2025년 첫 5개월 동안 미국 내에서 696,000건 이상의 일자리가 줄었는데, 이는 전년도 대비 80% 증가한 수치다.체스키의 비전에서의 과제는, 일자리를 잃은 지식 노동자들이 숙박 호스팅 역할에 필요한 창업 역량을 갖추었는지, 경제적 압박 상황에서 높은 실업률이 여행 수요에 영향을 끼칠 것인지에 있다. 그럼에도 그의 전략은 인간 중심의 서비스가 AI 중심의 직장 변화 물결 속에서 하나의 돌파구가 될 수 있음을 시사한다.
1548 조회
0 추천
2025.09.11 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입