AI 뉴스

AI 기업들, 에이전트 훈련 위해 RL환경에 막대한 투자

페이지 정보

작성자 xtalfi
작성일 2025.09.18 02:43
3,136 조회
0 추천
0 비추천

본문

ca0c201d210a9aa7767c3b612bfe399edvaM.png

(퍼플렉시티가 정리한 기사)

주요 AI 기업들은 보다 능력 있는 AI 에이전트를 만들기 위해 강화학습 환경에 전례 없는 투자를 쏟아붓고 있으며, Anthropic은 내년에 이러한 정교한 훈련 플랫폼에 10억 달러 이상을 지출할 계획이라고 전해졌다. 이 대규모 자금 지원은 실리콘밸리에서 기존 AI 훈련 방식이 한계에 도달했으며, 진정으로 자율적인 AI 시스템을 개발하려면 새로운 접근이 필요하다는 인식이 커지고 있음을 보여준다.


강화학습 환경은 AI 에이전트가 단순히 텍스트를 처리하는 것보다 실제로 행동하면서 학습할 수 있는 시뮬레이션 작업 공간 역할을 한다. 2025년 9월에 보고된 바에 따르면, 이러한 가상 훈련장은 AI 에이전트가 소프트웨어 애플리케이션을 탐색하거나 Salesforce를 통해 고객 관계를 관리하거나, 의료 시스템에서 의료 기록을 처리하는 등 복잡한 과업을 연습할 수 있게 해준다. 이전 세대 AI를 구동했던 고정된 데이터셋과 달리, 이러한 동적 환경은 실시간 피드백을 제공하고 예측할 수 없는 에이전트의 행동에 맞춰 적응한다.


스타트업들이 수요에 부응하기 위해 서두르고 있다


수요의 급증으로 인해 잘 자금이 지원된 신생 스타트업들이 RL(강화 학습) 환경 제공의 패권을 차지하기 위해 경쟁하는 새로운 카테고리가 탄생했습니다. 모든 직업의 자동화를 대담하게 목표로 지난해 6개월 전에 설립된 메카나이즈 워크(Mechanize Work)는 AI 코딩 에이전트를 위한 고도화된 훈련 환경을 구축하기 위해 소프트웨어 엔지니어에게 연봉 50만 달러를 제안하고 있습니다. 소식통에 따르면 이 스타트업은 이미 Anthropic과 RL 프로젝트를 진행 중이라고 합니다.


저명한 AI 연구원 안드레이 카파시(Andrej Karpathy)와 파운더스 펀드(Founders Fund)가 지원하는 프라임 인텔렉트(Prime Intellect)는 “RL 환경을 위한 허깅페이스(Hugging Face)“를 자처하며, 2025년 8월에 출시된 오픈소스 플랫폼으로 소규모 개발자들을 겨냥하고 있습니다. 이 회사는 2025년 3월에 1,500만 달러의 자금을 조달하며 이러한 강력한 훈련 도구에 대한 접근을 민주화하는 것을 목표로 하고 있습니다.


기존 데이터 라벨링 업체들도 이 기회를 포착하기 위해 전략을 수정하고 있습니다. 지난해 12억 달러의 매출을 올린 것으로 알려진 서지 AI(Surge AI)는 AI 연구소의 수요 증가에 대응해 RL 환경 구축을 위한 전담 내부 조직을 만들었습니다. 연간화 매출 4억 5천만 달러와 100억 달러 가치로 투자를 유치 중인 머커(Mercor)는 코딩, 헬스케어, 법률 등 분야별 환경을 개발하고 있습니다.


시장 경쟁이 심화된다


경쟁 구도는 기업들이 이 신흥 분야에서 우위를 차지하기 위해 치열한 경쟁을 벌이면서 점점 더 치열해지고 있습니다. 한때 AI 데이터 라벨링 분야의 독보적인 선도 업체였던 Scale AI는 Meta가 회사에 막대한 투자를 하고 CEO를 영입한 뒤, OpenAI와 Google가 Scale을 고객에서 제외하면서 상당한 도전에 직면했습니다. 이로 인해 Surge와 Mercor와 같은 경쟁 업체들이 시장 점유율을 확대할 기회를 얻게 되었습니다.


업계 관계자들에 따르면, RL 환경에 대한 투자는 AI 시스템의 학습 방식에 근본적인 변화를 가져오고 있습니다. Surge의 CEO인 에드윈 첸(Edwin Chen)은 “OpenAI와 Anthropic이 자신들의 모델을 개선하는 방식은 실제로 인간의 학습 과정을 모방하고 있으며, 강화 학습 환경은 AI가 실제 세계에서 살아가는 것과 같다”고 설명했습니다.


도전과 회의론


막대한 투자에도 불구하고, 상당한 기술 및 사업적 과제들이 여전히 남아 있습니다. 비평가들은 AI 모델이 실제로 의도한 작업을 수행하지 않고 보상을 얻기 위한 허점을 찾아내는 “보상 해킹”과 같은 문제를 지적합니다. 환경 자체에는 긍정적 입장을 보이면서도, Andrej Karpathy는 강화 학습에 대해서는 신중한 태도를 보이며 “강화 학습에만 한정해선 부정적 시각을 갖고 있다”고 언급했습니다.


업계의 공감대는 RL 환경이 차세대 AI 에이전트 개발에 핵심적이며, OpenAI의 o1 모델 및 Anthropic의 Claude 시스템 등 최근의 혁신을 가능하게 했다고 봅니다. 하지만 이러한 환경에서 지능을 추출하는 최적의 방법과 확장성에 관한 의문이 연구자와 투자자들 사이에서 끊임없이 논쟁을 불러일으키고 있습니다.

댓글 0
전체 1,366 / 297 페이지
(퍼플렉시티가 정리한 기사)구글 은 30억 달러 규모의 인공지능 데이터 센터 계약의 일환으로 지분 5.4%를 인수할 예정입니다. 이번 계약은 기술 대기업의 AI 인프라에 대한 공격적인 진출과 암호화폐 채굴 산업의 고성능 컴퓨팅 분야로의 전환을 부각시킵니다.수요일 발표된 10년 계약에 따르면, 구글은 약 2,400만 주의 사이퍼 주식 매입 워런트를 받게 되며, 동시에 AI 클라우드 플랫폼 플루이드스택(Fluidstack)의 임대 의무 14억 달러도 보증합니다. 사이퍼는 텍사스주 콜로라도 시티에 위치한 바버레이크(Barber Lake) 사이트에서 중요 IT 부하 168메가와트를 공급할 예정이며, 운영은 2026년 9월까지 시작될 것으로 예상됩니다.비트코인에서 인공지능 컴퓨팅까지이번 계약은 전통적인 비트코인 채굴 사업에서 급성장하는 AI 분야를 겨냥한 이중 목적의 인프라 제공업체로 발전한 사이퍼(Cipher)에게 극적인 변화를 의미합니다. 회사의 이러한 변화는 기존의 전력을 활용하고 냉각 기술 전문성을 바탕으로 더 고부가가치인 AI 워크로드를 확보하려는 암호화폐 채굴업계의 광범위한 트렌드를 반영합니다.사이퍼의 CEO 타일러 페이지(Tyler Page)는 “우리는 Fluidstack과 함께 고성능 컴퓨팅(HPC) 데이터 센터를 개발하게 되어 매우 기쁩니다. 구글을 사이퍼의 투자자로 맞이할 날을 기대하고 있습니다”라고 말했습니다. 이번 거래를 통해 사이퍼는 2.4기가와트의 고성능 컴퓨팅 우선 파이프라인을 앞세운 주요 AI 데이터 센터 개발업체로 자리매김하게 되었습니다.2017년에 설립된 플루이드스택(Fluidstack)은 AI 학습과 추론을 위한 GPU 클러스터의 온디맨드 접근을 제공하며, 주요 테크 기업과 AI 연구소를 포함한 고객에게 서비스를 제공하고 있습니다. 런던에 기반을 둔 이 스타트업은 최근 프랑스 정부와 110억 달러 규모의 계약을 체결해 원자력 기반 AI 슈퍼컴퓨터를 구축하기로 했습니다.AI 인프라 투자 급증이번 파트너십은 AI 인프라에 대한 전례 없는 투자가 이뤄지는 가운데 체결되었습니다. 전 세계 AI 인프라 지출은 2025년에 3,750억 달러, 2026년에는 5,000억 달러에 이를 것으로 전망됩니다. 맥킨지는 AI 연산 수요를 충족하기 위해 2030년까지 전 세계 데이터 센터에 6.7조 달러의 투자가 필요할 것으로 추정하고 있습니다.구글의 투자는 기존의 인프라 확장 전략과 맞물려 있습니다. 최근 버지니아에 90억 달러, 영국에 50억 파운드의 AI 및 클라우드 시설 투자 약속도 포함됩니다. 사이퍼와의 계약은 2회의 5년 연장 옵션이 행사될 경우 최대 70억 달러로 확대될 수 있습니다.이번 발표 이후 사이퍼 주가는 장전 거래에서 11% 급등하며, 연초 대비 205%의 수익률에 추가 상승세를 보였습니다. 이번 파트너십은 비트코인 채굴업체들이 보유한 전력 용량과 기술 전문성을 활용해 급성장하는 인공지능 산업에서 수익을 창출하려는 전략적 전환을 입증하는 사례입니다.
3055 조회
0 추천
2025.09.26 등록
(퍼플렉시티가 정리한 기사)소매 투자자들이 주식 선정을 위해 인공지능 챗봇을 점점 더 많이 활용하면서, 로보어드바이저 시장이 폭발적으로 성장해 2029년에는 업계 분석가들이 예측한 4,709억 1천만 달러의 수익을 기록할 것으로 예상되고 있습니다. 이는 지난해의 617억 5천만 달러에서 600% 이상의 급증입니다.ChatGPT가 오는 11월 세 번째 생일을 앞두고 있는 가운데, 이미 최소 13%의 소매 투자자들이 이 인기 챗봇을 주식 선정에 활용하고 있으며, 추가로 50%는 투자 결정을 위해 AI 도구 사용을 고려할 것이라고 11,000명의 글로벌 소매 투자자를 대상으로 한 증권사 eToro의 조사 결과 밝혀졌습니다. 이 현상은 한때 대형 금융기관과 전문 투자자에게만 한정되었던 투자 분석을 대중화시켰습니다.전직 월스트리트 애널리스트들이 AI 도입을 주도하다스위스 은행 UBS에서 거의 20년 동안 기업을 분석해온 Jeremy Leung은 올해 초 직장을 잃은 후 이러한 경향을 대표하고 있습니다. 비싼 블룸버그 단말기나 프리미엄 시장 데이터 서비스에 접근할 수 없게 된 Leung은 이제 그의 멀티-자산 투자 포트폴리오 관리를 위해 ChatGPT를 활용하고 있습니다.“심지어 단순한 ChatGPT 도구만으로도 많은 일을 할 수 있고, 내가 이전에 했던 워크플로우를 상당 부분 복제할 수 있다”고 Leung은 말했으나, 이런 도구들이 유료 서비스 뒤에 있는 데이터에 접근하지 못해 중요한 분석을 놓칠 수 있다는 점을 경고했습니다.ChatGPT의 효과를 극대화하기 위해 Leung은 “당신이 숏 분석가라고 가정하고, 이 종목의 숏 투자 논거를 제시하라”와 같이 구체적인 프롬프트를 만들고, “SEC 공시와 같은 신뢰할 수 있는 소스만 사용하라”고 AI에게 지시합니다. 이러한 접근은 테크놀로지의 한계를 이해하는 AI 보조 투자자들 사이에서 점점 정교해지고 있는 트렌드를 반영합니다.AI 포트폴리오가 전통적인 펀드보다 더 높은 성과를 기록하다실질적인 결과는 눈에 띄게 나타났습니다. 비교 조사 업체 Finder가 2023년 3월 ChatGPT에 부채 수준, 지속적인 성장, 경쟁 우위 등 기준에 따라 우량 기업의 주식을 선별하도록 요청했을 때, 이렇게 선정된 38종목 포트폴리오의 수익률은 거의 55%에 달했습니다. 이 포트폴리오에는 AI 선두주자인 엔비디아 , 전자상거래 대기업 아마존 , 그리고 프로터 & 갬블 , 월마트 와 같은 필수소비재 기업이 포함되어 있으며, 영국에서 가장 인기 있는 10대 펀드의 평균 수익률을 거의 19%포인트 웃돌았습니다.이러한 성공은 미국 증시가 사상 최고치 부근을 맴도는 가운데, S&P 500 지수는 2024년에 23% 급등한 데 이어 올해도 13% 상승한 상황에서 이루어졌습니다. 그러나 전문가들은 이러한 성과가 모든 시장 상황에서 지속되지 않을 수 있다고 경고합니다.업계의 고위험 전략 경고인상적인 결과에도 불구하고, 금융업계 전문가들은 AI 기반 주식 선별이 상당한 위험을 수반한다고 경고한다. 전 세계적으로 3,000만 명의 사용자를 보유한 eToro의 영국 지사장 댄 모츨스키(Dan Moczulski)는 “ChatGPT나 Gemini 같은 범용 모델을 마치 예언 도구처럼 여길 때 위험이 발생한다”고 경고한다.모츨스키는 시장 분석을 위해 특별히 훈련된 AI 플랫폼의 사용을 옹호하며, “일반적인 AI 모델은 수치와 날짜를 잘못 인용하거나, 지나치게 미리 정해진 내러티브에 의존하며, 과거 가격 동향에 지나치게 의지해 미래를 예측하려 할 수 있다”고 지적한다.ChatGPT 자체도 사용자에게 전문적인 금융 조언에 의존하지 말라고 경고하며, 모기업인 OpenAI 또한 얼마나 많은 사람들이 투자 결정을 위해 챗봇을 사용하는지에 대한 데이터를 공개하지 않았다. AI 도구에 대한 열광은 일반 투자자들이 시장 하락 시 잠재적 손실을 방지하기 위한 적절한 리스크 관리 전략을 구사하고 있는지에 대한 우려를 낳고 있다.
3098 조회
0 추천
2025.09.25 등록
(퍼플렉시티가 정리한 기사)스포티파이 는 목요일에 인공지능 음악 정책에 대한 대대적인 변화를 발표하며, 딥페이크와 스팸을 막기 위한 새로운 안전장치를 도입했다고 밝혔습니다. 또한 지난 1년 동안 플랫폼에서 7천5백만 개가 넘는 문제 있는 트랙을 삭제했다고 공개했습니다. 이 스트리밍 대기업의 세 가지 전략은 AI 기반 사기와 맞서면서도 기술의 정당한 예술적 활용을 지원하는 데 목적이 있으며, AI 생성 콘텐츠가 음악 플랫폼을 급격히 증가하는 상황에 대한 스포티파이의 가장 포괄적인 대응을 의미합니다.새로운 기준이 AI 투명성과 스팸을 겨냥하다회사는 DDEX(Digital Data Exchange)가 개발한 AI 음악 공개를 위한 새로운 업계 표준을 도입할 예정이며, 이를 통해 아티스트와 레이블이 창작 과정에서 인공지능이 어떻게 사용되었는지 정확하게 명시할 수 있습니다. 이 시스템 하에서는 크리에이터가 AI가 보컬을 생성했는지, 악기를 연주했는지, 또는 후반 작업을 처리했는지 여부를 나타낼 수 있어, 단순한 “AI 여부” 구분을 넘어서게 됩니다.Spotify의 글로벌 마케팅 및 정책 총괄인 샘 두보프(Sam Duboff)는 언론 브리핑에서 “AI의 활용은 하나의 스펙트럼이 될 것이며, 아티스트와 프로듀서들은 창작 프로세스의 여러 부분에서 AI를 결합하게 될 것입니다”라고 말했습니다. “이 업계 표준은 보다 정확하고 세밀한 공개를 가능하게 합니다.”Spotify는 또한 올가을 대량 업로드, 중복 트랙, SEO 조작, 로열티 지급을 노린 인위적으로 짧은 곡 등 음악 스팸을 겨냥한 강화된 필터를 도입할 예정입니다. 해당 필터는 문제 upload자를 식별하여 이들의 트랙을 알고리즘 추천에서 제거하지만, 완전히 삭제하지는 않을 예정입니다.AI 음악 논란에 따른 강경 조치정책 개편은 제대로 된 공개 없이 AI가 생성한 아티스트들이 엄청난 성공을 거두며 논란이 커지는 것에 대한 대응으로 이루어졌다. 완전히 AI로 만들어진 것이 확인되기 전까지 스포티파이에서 월 100만 명 이상의 청취자를 모은 ‘벨벳 선다운’은 플랫폼의 투명성 문제를 보여주는 대표적인 사례였다. 이 밴드의 곡들은 인기 플레이리스트와 사용자들의 ‘Discover Weekly’ 추천곡에 등장했으나, AI로 생성된 프로필 사진과 가짜 밴드 멤버 약력 등 불분명한 부분을 레딧 이용자들이 지적하기도 했다.스포티파이 경영진은 플랫폼이 고의로 AI 생성 콘텐츠를 홍보해 저작권료 지급을 줄이려 한다는 지속적인 소문에 대해 직접 해명했다. 정책 브리핑에서 샘 두보프는 “그런 소문들은 단호하게, 그리고 완전히 사실이 아닙니다”라고 밝혔다. “스포티파이는 어떤 음악도 직접 생성하지 않습니다. 저희가 음악을 소유하지도 않습니다. 스포티파이에 있는 모든 음악, 100%는 라이선스를 받은 제3자가 만든 것이고, 업로드한 것입니다.” 회사는 정당한 AI 활용은 지지하는 한편, 노스캐롤라이나의 뮤지션이 AI를 이용해 ‘수십만 곡’을 만들어 1천만 달러 이상 부정 스트리밍 로열티를 챙긴 사례 등과 같은 사기에는 강력하게 대응할 것임을 강조했다.
3038 조회
0 추천
2025.09.25 등록
(퍼플렉시티가 정리한 기사)SK텔레콤 이 AI 사업을 총괄하는 사내회사(CIC) 출범을 발표하며 2030년 연매출 5조원 달성을 목표로 5년간 5조원을 투자한다고 밝혔다. 유영상 CEO가 25일 전 구성원 대상 타운홀 미팅을 열고 이같은 내용을 발표했다.AI CIC 조직 체계와 목표AI CIC는 에이닷(A.) 서비스, 기업용 에이닷 비즈, AI 데이터센터 사업, 글로벌 AI 제휴투자, AI R&D, 메시징·인증 사업 등 전사 AI 관련 기능과 조직을 통합해 운영된다. 유영상 CEO가 직접 AI CIC 대표를 겸임하며, 세부 조직 개편은 10월 말 시행될 예정이다.유 CEO는 “급변하는 AI 환경 변화에 따라 위기와 기회가 공존하는 AI 골든타임을 놓치지 않기 위해서는 수요자 관점의 내부 AI 혁신과 공급자 관점의 AI 사업 혁신이 필요하다”며 AI CIC 출범 배경을 설명했다.사업 전략과 성과 기반AI CIC는 AI 수요(B2C, B2B)와 공급(AI 인프라)의 안정적 선순환을 통해 독자 생존 가능한 수익 구조를 확보할 계획이다. B2C는 에이닷을 중심으로 국내외 가입자 기반을 확대하고, B2B는 에이전틱 AI 서비스를 통한 생산성 향상 입증과 제조 AI 분야 레퍼런스 확보에 집중한다.SK텔레콤은 지난 3년간 AI 컴퍼니 전환을 통해 에이닷 1000만 가입자 확보, 독자 AI 파운데이션 모델 선정, 울산 AI DC 착수, 글로벌 파트너십 구축 등의 성과를 달성했다고 발표했다. 에이닷은 정식 출시 22개월 만에 가입자 1000만명을 돌파했으며, 월간 활성사용자수(MAU)는 약 810만명에 달한다.울산 AI 데이터센터의 경우 7조원을 투자해 축구장 11개 규모의 연면적 2만평 이상으로 건설되며, 6만장 가량의 GPU를 수용할 수 있는 국내 최대 규모의 AI 전용 하이퍼스케일 데이터센터로 2027년 말부터 단계적 가동을 시작할 예정이다.
3070 조회
0 추천
2025.09.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입