AI 뉴스

AI 기업들, 에이전트 훈련 위해 RL환경에 막대한 투자

페이지 정보

작성자 xtalfi
작성일 2025.09.18 02:43
756 조회
0 추천
0 비추천

본문

ca0c201d210a9aa7767c3b612bfe399edvaM.png

(퍼플렉시티가 정리한 기사)

주요 AI 기업들은 보다 능력 있는 AI 에이전트를 만들기 위해 강화학습 환경에 전례 없는 투자를 쏟아붓고 있으며, Anthropic은 내년에 이러한 정교한 훈련 플랫폼에 10억 달러 이상을 지출할 계획이라고 전해졌다. 이 대규모 자금 지원은 실리콘밸리에서 기존 AI 훈련 방식이 한계에 도달했으며, 진정으로 자율적인 AI 시스템을 개발하려면 새로운 접근이 필요하다는 인식이 커지고 있음을 보여준다.


강화학습 환경은 AI 에이전트가 단순히 텍스트를 처리하는 것보다 실제로 행동하면서 학습할 수 있는 시뮬레이션 작업 공간 역할을 한다. 2025년 9월에 보고된 바에 따르면, 이러한 가상 훈련장은 AI 에이전트가 소프트웨어 애플리케이션을 탐색하거나 Salesforce를 통해 고객 관계를 관리하거나, 의료 시스템에서 의료 기록을 처리하는 등 복잡한 과업을 연습할 수 있게 해준다. 이전 세대 AI를 구동했던 고정된 데이터셋과 달리, 이러한 동적 환경은 실시간 피드백을 제공하고 예측할 수 없는 에이전트의 행동에 맞춰 적응한다.


스타트업들이 수요에 부응하기 위해 서두르고 있다


수요의 급증으로 인해 잘 자금이 지원된 신생 스타트업들이 RL(강화 학습) 환경 제공의 패권을 차지하기 위해 경쟁하는 새로운 카테고리가 탄생했습니다. 모든 직업의 자동화를 대담하게 목표로 지난해 6개월 전에 설립된 메카나이즈 워크(Mechanize Work)는 AI 코딩 에이전트를 위한 고도화된 훈련 환경을 구축하기 위해 소프트웨어 엔지니어에게 연봉 50만 달러를 제안하고 있습니다. 소식통에 따르면 이 스타트업은 이미 Anthropic과 RL 프로젝트를 진행 중이라고 합니다.


저명한 AI 연구원 안드레이 카파시(Andrej Karpathy)와 파운더스 펀드(Founders Fund)가 지원하는 프라임 인텔렉트(Prime Intellect)는 “RL 환경을 위한 허깅페이스(Hugging Face)“를 자처하며, 2025년 8월에 출시된 오픈소스 플랫폼으로 소규모 개발자들을 겨냥하고 있습니다. 이 회사는 2025년 3월에 1,500만 달러의 자금을 조달하며 이러한 강력한 훈련 도구에 대한 접근을 민주화하는 것을 목표로 하고 있습니다.


기존 데이터 라벨링 업체들도 이 기회를 포착하기 위해 전략을 수정하고 있습니다. 지난해 12억 달러의 매출을 올린 것으로 알려진 서지 AI(Surge AI)는 AI 연구소의 수요 증가에 대응해 RL 환경 구축을 위한 전담 내부 조직을 만들었습니다. 연간화 매출 4억 5천만 달러와 100억 달러 가치로 투자를 유치 중인 머커(Mercor)는 코딩, 헬스케어, 법률 등 분야별 환경을 개발하고 있습니다.


시장 경쟁이 심화된다


경쟁 구도는 기업들이 이 신흥 분야에서 우위를 차지하기 위해 치열한 경쟁을 벌이면서 점점 더 치열해지고 있습니다. 한때 AI 데이터 라벨링 분야의 독보적인 선도 업체였던 Scale AI는 Meta가 회사에 막대한 투자를 하고 CEO를 영입한 뒤, OpenAI와 Google가 Scale을 고객에서 제외하면서 상당한 도전에 직면했습니다. 이로 인해 Surge와 Mercor와 같은 경쟁 업체들이 시장 점유율을 확대할 기회를 얻게 되었습니다.


업계 관계자들에 따르면, RL 환경에 대한 투자는 AI 시스템의 학습 방식에 근본적인 변화를 가져오고 있습니다. Surge의 CEO인 에드윈 첸(Edwin Chen)은 “OpenAI와 Anthropic이 자신들의 모델을 개선하는 방식은 실제로 인간의 학습 과정을 모방하고 있으며, 강화 학습 환경은 AI가 실제 세계에서 살아가는 것과 같다”고 설명했습니다.


도전과 회의론


막대한 투자에도 불구하고, 상당한 기술 및 사업적 과제들이 여전히 남아 있습니다. 비평가들은 AI 모델이 실제로 의도한 작업을 수행하지 않고 보상을 얻기 위한 허점을 찾아내는 “보상 해킹”과 같은 문제를 지적합니다. 환경 자체에는 긍정적 입장을 보이면서도, Andrej Karpathy는 강화 학습에 대해서는 신중한 태도를 보이며 “강화 학습에만 한정해선 부정적 시각을 갖고 있다”고 언급했습니다.


업계의 공감대는 RL 환경이 차세대 AI 에이전트 개발에 핵심적이며, OpenAI의 o1 모델 및 Anthropic의 Claude 시스템 등 최근의 혁신을 가능하게 했다고 봅니다. 하지만 이러한 환경에서 지능을 추출하는 최적의 방법과 확장성에 관한 의문이 연구자와 투자자들 사이에서 끊임없이 논쟁을 불러일으키고 있습니다.

댓글 0
전체 610 / 91 페이지
(퍼플렉시티가 정리한 기사)Nvidia이 월요일에 OpenAI와 획기적인 전략적 파트너십을 발표했으며, Nvidia의 시스템을 활용해 최소 10기가와트 규모의 AI 데이터 센터를 구축하기 위해 최대 1,000억 달러를 투자하기로 약속했습니다. 이 대규모 인프라 구축의 1단계는 2026년 하반기에 Nvidia의 새로운 Vera Rubin 플랫폼을 사용하여 시작될 예정입니다.이번 파트너십은 역사상 가장 큰 기술 거래 중 하나로, Nvidia는 각 기가와트 용량이 가동될 때마다 점진적으로 1,000억 달러를 투자할 계획입니다. Jensen Huang Nvidia 창립자 겸 CEO에 따르면, “이번 투자와 인프라 파트너십은 다음 시대의 지능을 이끌 10기가와트 배치라는 또 다른 도약을 의미합니다”.대규모 인프라 구축10기가와트 규모의 배치는 OpenAI가 초지능 개발을 목표로 하는 과정에서 수백만 개의 Nvidia GPU로 구성될 예정입니다. 이 규모를 이해하기 쉽게 설명하자면, Nvidia CEO 젠슨 황은 데이터 센터의 1기가와트 용량마다 약 500~600억 달러의 투자가 필요하며, 이 중 약 350억 달러가 Nvidia 칩과 시스템에 해당한다고 추정한 바 있습니다.이번 파트너십은 Nvidia의 최첨단 Vera Rubin NVL144 CPX 플랫폼을 활용합니다. 이 플랫폼은 단일 랙에 8 엑사플롭스의 AI 연산 성능을 제공하며, Nvidia의 기존 GB300 NVL72 시스템 대비 7.5배 더 높은 성능을 발휘합니다. Rubin CPX GPU는 백만 토큰의 코딩과 생성형 영상 애플리케이션 등 방대한 컨텍스트의 AI 처리를 위해 특별히 설계되었습니다.OpenAI CEO 샘 올트먼은 전략적 중요성을 강조하며 다음과 같이 밝혔습니다: “모든 것은 컴퓨트에서 시작됩니다. 컴퓨트 인프라는 미래 경제의 토대가 될 것이며, 우리가 Nvidia와 함께 구축하는 것을 바탕으로 새로운 AI 혁신을 창출하고 그 혁신을 사람들과 기업에 대규모로 제공할 것입니다”.전략적 포지셔닝 및 시장 환경이번 파트너십은 AI 혁명의 두 핵심 기업 사이의 관계를 크게 강화합니다. 현재 주간 활성 사용자 7억 명 이상을 보유한 OpenAI는 AI 팩토리 성장 계획을 위해 Nvidia를 선호하는 전략적 컴퓨팅 및 네트워킹 파트너로 선정하여 협력할 예정입니다.이번 계약은 Microsoft, Oracle, SoftBank 등 주요 파트너들과 진행 중인 OpenAI의 인프라 사업을 Stargate 프로젝트를 통해 보완합니다. 2025년 1월에 발표된 Stargate 이니셔티브는 미국 전역에 AI 인프라를 구축하기 위해 최대 5,000억 달러를 투자할 계획입니다.이번 발표는 양사가 글로벌 AI 인프라 확장에 박차를 가하는 가운데 나왔습니다. 최근 보도에 따르면, Nvidia와 OpenAI는 영국 데이터 센터에도 수십억 달러 규모의 투자를 계획하고 있으며, 트럼프 대통령의 영국 방문 시 Nscale 운영사와 협력할 예정입니다.양사는 기술 로드맵을 공동 최적화할 것이며, OpenAI의 모델 및 인프라 소프트웨어가 Nvidia의 하드웨어 및 소프트웨어 플랫폼과 긴밀하게 연동될 예정입니다. 이러한 깊은 통합은 AI의 지속적인 기하급수적 성장과 인공지능 일반을 달성하기 위해 필요한 엄청난 컴퓨팅 수요에 대한 전략적 선택을 의미합니다.
645 조회
0 추천
2025.09.23 등록
(퍼플렉시티로 출처 기사를 요약)최근 스탠퍼드 대학과 Arc Institute 연구진이 자체 개발한 인공지능(AI) 모델 ‘이보(Evo)’를 활용해 세계 최초로 인공 지능이 바이러스 유전체를 설계하고, 실제로 기능하는 바이러스를 만들어내는 데 성공했다고 2025년 9월 17일 네이처에 발표했다. 이 바이러스들은 항생제 내성 균주를 포함한 여러 대장균(E. coli) 균주를 감염시키고 죽일 수 있는 기능성을 갖췄다.복잡한 유전체 설계 도전바이러스 등 생명체 유전체 설계는 매우 복잡해 기존 AI는 단백질 단위나 부분 유전체 생성 정도에 머물렀다. 이번 연구는 완전한 5,386개 염기쌍, 11개 유전자를 가진 단일 가닥 DNA 바이러스 ΦX174(파이엑스174)를 설계 모델로 삼았다. Evo AI는 이미 200만 개가 넘는 박테리오파지 유전체를 학습했으며, ΦX174 유전체와 유사한 구조를 갖되 E. coli 특정 균주를 감염시킬 수 있도록 설계 방향을 맞췄다.AI 설계와 실험적 검증연구진은 수천 개 AI가 생성한 후보 바이러스 유전체 중 302개를 선정해 실험실 합성 후 박테리아 배양에 투입했다. 그 결과 16개 바이러스가 실제로 대장균을 감염시키고 죽이는 능력을 보였으며, 일부는 자연계에 존재하지 않는 돌연변이 조합을 포함해 이전 바이러스가 공격하지 못했던 균주들도 감염시켰다.신뢰와 안전을 위한 노력“AI가 완벽한 유전체 설계를 달성한 것은 최초”라고 컴퓨테이셔널 생물학자 브라이언 히(Brian Hie)는 말했다. 그러면서 “향후 AI가 완전한 생명체를 설계하는 단계로 나아갈 것”이라 전망했다. 다만, 연구진은 바이오안전과 오남용 위험에 매우 신중하며, 동료평가 전임을 알리고 추가 실험과 안전 검증이 필요하다고 밝혔다.미래의 바이오테크놀로지이번 연구는 향후 항생제 내성균 대응을 위한 파지(박테리아 감염 바이러스) 치료법 개발, 유전자 전달벤치마킹과 합성생물학 응용 등 바이오기술 혁명에 한 획을 그을 큰 진전으로 평가된다. AI가 바이러스 같은 유전체 단위 생명 설계를 현실화하면서 맞춤형 생명공학과 의료 분야에 혁신을 가져올 전망이다.
652 조회
0 추천
2025.09.22 등록
(퍼플렉시티가 정리한 기사)나스닥에 상장된 대마초 회사인 플로라 그로스(Flora Growth)는 4억 100만 달러 규모의 사모 투자를 완료하며, 최초로 제로 그래비티(Zero Gravity, 0G) 토큰을 보유한 상장사가 되어 대마초 사업에서 블록체인 인프라 투자로 극적인 전환을 이루었습니다. 이 거래는 주주 승인에 따라 9월 26일까지 마감될 예정입니다.이번 거래는 3,500만 달러의 현금과 3억 6,600만 달러 상당의 디지털 자산(주로 개당 3달러로 평가된 0G 토큰)으로 구성되어 있습니다. 이번 투자는 약 4억 8,000만 달러 상당의 솔라나(SOL) 토큰을 보유한 솔라나 자산관리 회사인 디파이 디벨롭먼트(DeFi Development Corp.)가 주도했으며, 헥스스톤 캐피털, 칼스버그 SE Asia PTE Ltd, Dao5, Abstract Ventures, Dispersion Capital 등 여러 회사가 참여했습니다.회사 리브랜딩 및 경영진 변경플로라 그로스는 나스닥에서 FLGC 티커 심볼을 유지하면서 ZeroStack으로 리브랜딩할 예정입니다. 회사는 0G의 공동 창립자인 마이클 하인리히를 이사회 의장으로, 다니엘 레이스-파리아를 CEO로 임명할 예정입니다. 새로 취임하는 CEO 다니엘 레이스-파리아는 "이 재무 전략은 기관 투자자들에게 투명하고, 검증 가능하며, 대규모로 비용 효율적이고 프라이버시를 최우선으로 하는 AI 개발을 가능하게 하는 기반 인프라에 주식 기반의 익스포저를 제공합니다"라고 밝혔습니다.플로라 그로스 주가는 발표 이후 장외 거래에서 69% 급등하며, 연초 대비 32% 하락을 반전시켰습니다. 해당 주식은 2025년 9월 19일에 $27.20으로 마감했습니다.Zero Gravity의 AI 인프라 주장제로 그래비티는 분산 클러스터를 이용해 1,070억 개의 파라미터 모델을 성공적으로 학습했다고 주장하는 탈중앙화 AI 블록체인을 개발 중으로, 구글(알파벳 Inc.) 등 빅테크 기업들의 벤치마크를 능가했다고 합니다. 이 프로젝트는 기존 분산 AI 프레임워크 대비 357배의 효율성 향상을 이루었다고 주장합니다.0G 재단은 월요일에 토큰을 에어드랍을 통해 배포할 예정이며, 이후 주요 암호화폐 거래소에서 상장될 예정입니다. 바이낸스는 0G를 42번째 HODLer 에어드랍 프로젝트로 발표했으며, 거래는 2025년 9월 22일부터 시작될 예정입니다. 쿠코인 역시 0G의 "월드 프리미어" 상장을 예고하며 9월 22일부터 거래가 시작될 것이라고 알렸습니다.디지털 자산 자금관리 동향Flora Growth의 거래는 기업들이 디지털 자산 재무 전략을 채택하는 전반적인 흐름 속에서 이루어지고 있습니다. 스탠다드차타드에 따르면, 디지털 자산 재무 기업들은 시장의 순자산 가치가 업계 전반에 걸쳐 급격히 하락하면서 점점 더 큰 압박을 받고 있습니다. 은행은 업계 전체의 통합을 예상하며, MicroStrategy Incorporated와 같은 자금력이 풍부한 대형 업체가 승자로 떠오를 것으로 보이고, 소형 업체들은 인수 대상이 될 수 있다고 내다봤습니다.DeFi Development Corp.의 CEO인 Joseph Onorati는 “우리는 이번 자금 조달에서 FLGC와 파트너십을 맺게 되어 매우 기쁘며, 0g와 Solana 간의 깊은 협업을 이끌어 나가길 기대합니다”라고 밝혔습니다. Flora는 이번 협업의 일환으로 자체 재무 자산의 일부를 SOL 토큰으로 보유할 예정입니다.Flora 거래에 사용된 토큰당 3달러의 가치는 Zero Gravity의 완전 희석 기준 기업 가치를 30억 달러로 산정하며, 이는 현재 시장 기준에서 기존의 암호화폐 프로젝트와 비슷한 수준입니다.
682 조회
0 추천
2025.09.22 등록
(퍼플렉시티가 정리한 기사)OpenAI는 기술 역사상 가장 야심찬 인프라 지출 계획 중 하나를 착수했습니다. 2030년까지 맞춤형 칩 개발, 대규모 데이터 센터 확장, 전례 없는 컴퓨팅 용량 조달을 아우르는 총 4,500억 달러 규모의 투자 전략을 발표한 것입니다. 여러 파트너십과 내부 전망을 통해 상세히 공개된 이 대규모 계획은 OpenAI의 CFO 사라 프라이어가 "항상 컴퓨트가 부족한 상태"라고 부르는 상황에 대응하기 위한 회사의 움직임을 나타냅니다. 이러한 제약으로 인해 제품 출시가 지연되고, 고급 AI 기능 배포가 제한되어 왔습니다.이번 투자는 OpenAI의 인프라 환경을 근본적으로 재편하고, 기존 클라우드 제공업체로부터 회사가 장기적으로 독립할 수 있는 역량을 갖추기 위한 여러 주요 요소를 포함합니다.스타게이트 프로젝트, 대규모 데이터 센터 확장 주도오픈AI 전략의 중심에는 'Stargate 프로젝트'가 있다. SoftBank, Oracle, 투자기업 MGX와의 5,000억 달러 규모의 합작 투자로, 2029년까지 미국 전역에 10기가와트의 AI 컴퓨팅 능력을 구축하는 것을 목표로 한다. 이 프로젝트는 2025년 1월 트럼프 대통령이 공식 발표했으며, 정부 관계자들은 이를 "미국 역사상 가장 야심찬 인프라 사업 중 하나"라고 설명한다.9월에는 오픈AI가 오라클과 3,000억 달러 규모의 계약을 공식화했다. 이 계약은 2027년부터 약 5년 동안 진행되며, 추가로 4.5기가와트의 데이터 센터 용량을 제공할 예정이다. 이로 인해 200만 개 이상의 AI 칩이 지원될 것으로 기대된다. 1단계인 'Stargate I'은 텍사스 주 애빌린에서 이미 운영 중이며, 오라클은 Nvidia GB200 랙을 공급하고 있으며, 이 시설에서는 초기 AI 학습 및 추론 작업이 이루어지고 있다.맞춤형 칩 개발로 엔비디아 의존도 감소OpenAI와 Broadcom(Broadcom Inc.)의 파트너십은 독자적인 하드웨어로의 전략적 전환을 의미합니다. 두 회사는 맞춤형 AI 추론 칩에 대해 100억 달러 규모의 계약을 최종 체결했으며, 대량 생산은 2026년으로 예정되어 있습니다. 이 애플리케이션 특화 집적 회로(ASIC)는 TSMC의 3나노미터 공정을 활용해 제조되며, 상업적으로 판매되지 않고 오직 OpenAI의 데이터 센터에서만 사용될 예정입니다.이 맞춤형 칩은 OpenAI가 겪고 있는 심각한 컴퓨팅 자원 부족을 해결하기 위해 고안되었습니다. CFO 사라 프라이어는 이를 회사의 주요 운영상 제약이라고 밝혔습니다. 프라이어는 "우리가 당면한 가장 큰 문제는 끊임없이 '컴퓨트 부족' 상태에 있다는 것입니다"라고 설명했으며, 이러한 부족 때문에 Sora 비디오 생성 모델과 같은 제품의 출시가 지연되고, 일부 기능은 기업 고객에게 제공되지 못했다고 덧붙였습니다.Broadcom CEO 혹 탄은 실적 발표에서 OpenAI로 널리 알려진 신규 고객으로부터 100억 달러 이상의 주문을 확보했으며, 2026회계연도 3분기부터 납품이 시작될 것이라고 확인했습니다. 이 파트너십은 Broadcom을 AI 하드웨어 분야에서 Nvidia의 지배력을 위협하는 주요 경쟁자로 자리매김시키며, 해당 칩 주문이 수천 개의 서버 랙에 분산된 1~2백만 개 XPU에 해당할 수 있습니다.1,000억 달러 백업 서버 전략으로 신뢰성 보장주요 인프라를 넘어, OpenAI는 향후 5년간 클라우드 공급업체로부터 백업 서버에 1,000억 달러를 투자할 계획입니다. 이는 2030년까지 서버 임대에 3,500억 달러를 투입하기로 한 기존 약속과는 별도의 예산입니다. 이러한 추가 용량은 제품 출시나 예기치 못한 사용량 급증 등 수요가 급격히 증가하는 상황에 대응하기 위해 마련된 것으로, 서비스 제한이나 출시 지연을 초래해온 지속적인 문제를 해결하기 위해서입니다.OpenAI 경영진은 이 백업 서버를 “수익 창출이 가능하다(monetiable)”고 보고 있으며, 이를 통해 연구 애플리케이션이나 일반적으로 수요가 낮은 기간 동안 제품 사용 증가를 통해 추가 수익을 얻을 수도 있다고 밝혔습니다. 주요 서버 지출과 합산할 경우, OpenAI는 향후 5년 동안 서버 임대 비용으로 연평균 약 850억 달러를 지출할 것으로 예상하고 있습니다.금융 아키텍처는 전례 없는 규모를 지원합니다막대한 인프라 투자는 오픈AI의 수정된 지출 예상에 의해 뒷받침되고 있습니다. 이는 2029년까지 1,150억 달러의 현금 소진이 예상되며, 이는 이전 추정치보다 800억 달러 증가한 수치입니다. 연간 지출은 2025년 80억 달러에서 2028-2029년에는 최대 450억~500억 달러까지 증가할 것으로 전망되며, 주로 컴퓨팅 비용과 인프라 확장에 의해 주도됩니다.이 확장을 위해 오픈AI는와의 파트너십을 재구성하고 있으며, 수익 공유 비율을 현재의 20%에서 2030년까지 약 8~10%로 낮출 예정입니다. 이 조정으로 수십억 달러의 자금을 재투자할 수 있게 되며, 마이크로소프트는 오픈AI가 영리 목적의 공익법인(Public Benefit Corporation)으로 전환할 계획에 따라 지분 보유 등 다양한 방식으로 보상을 받게 됩니다.
662 조회
0 추천
2025.09.22 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입