Loading...

AI 뉴스

AI 기업들, 에이전트 훈련 위해 RL환경에 막대한 투자

페이지 정보

작성자 xtalfi
작성일 2025.09.18 02:43
306 조회
0 추천
0 비추천

본문

ca0c201d210a9aa7767c3b612bfe399edvaM.png

(퍼플렉시티가 정리한 기사)

주요 AI 기업들은 보다 능력 있는 AI 에이전트를 만들기 위해 강화학습 환경에 전례 없는 투자를 쏟아붓고 있으며, Anthropic은 내년에 이러한 정교한 훈련 플랫폼에 10억 달러 이상을 지출할 계획이라고 전해졌다. 이 대규모 자금 지원은 실리콘밸리에서 기존 AI 훈련 방식이 한계에 도달했으며, 진정으로 자율적인 AI 시스템을 개발하려면 새로운 접근이 필요하다는 인식이 커지고 있음을 보여준다.


강화학습 환경은 AI 에이전트가 단순히 텍스트를 처리하는 것보다 실제로 행동하면서 학습할 수 있는 시뮬레이션 작업 공간 역할을 한다. 2025년 9월에 보고된 바에 따르면, 이러한 가상 훈련장은 AI 에이전트가 소프트웨어 애플리케이션을 탐색하거나 Salesforce를 통해 고객 관계를 관리하거나, 의료 시스템에서 의료 기록을 처리하는 등 복잡한 과업을 연습할 수 있게 해준다. 이전 세대 AI를 구동했던 고정된 데이터셋과 달리, 이러한 동적 환경은 실시간 피드백을 제공하고 예측할 수 없는 에이전트의 행동에 맞춰 적응한다.


스타트업들이 수요에 부응하기 위해 서두르고 있다


수요의 급증으로 인해 잘 자금이 지원된 신생 스타트업들이 RL(강화 학습) 환경 제공의 패권을 차지하기 위해 경쟁하는 새로운 카테고리가 탄생했습니다. 모든 직업의 자동화를 대담하게 목표로 지난해 6개월 전에 설립된 메카나이즈 워크(Mechanize Work)는 AI 코딩 에이전트를 위한 고도화된 훈련 환경을 구축하기 위해 소프트웨어 엔지니어에게 연봉 50만 달러를 제안하고 있습니다. 소식통에 따르면 이 스타트업은 이미 Anthropic과 RL 프로젝트를 진행 중이라고 합니다.


저명한 AI 연구원 안드레이 카파시(Andrej Karpathy)와 파운더스 펀드(Founders Fund)가 지원하는 프라임 인텔렉트(Prime Intellect)는 “RL 환경을 위한 허깅페이스(Hugging Face)“를 자처하며, 2025년 8월에 출시된 오픈소스 플랫폼으로 소규모 개발자들을 겨냥하고 있습니다. 이 회사는 2025년 3월에 1,500만 달러의 자금을 조달하며 이러한 강력한 훈련 도구에 대한 접근을 민주화하는 것을 목표로 하고 있습니다.


기존 데이터 라벨링 업체들도 이 기회를 포착하기 위해 전략을 수정하고 있습니다. 지난해 12억 달러의 매출을 올린 것으로 알려진 서지 AI(Surge AI)는 AI 연구소의 수요 증가에 대응해 RL 환경 구축을 위한 전담 내부 조직을 만들었습니다. 연간화 매출 4억 5천만 달러와 100억 달러 가치로 투자를 유치 중인 머커(Mercor)는 코딩, 헬스케어, 법률 등 분야별 환경을 개발하고 있습니다.


시장 경쟁이 심화된다


경쟁 구도는 기업들이 이 신흥 분야에서 우위를 차지하기 위해 치열한 경쟁을 벌이면서 점점 더 치열해지고 있습니다. 한때 AI 데이터 라벨링 분야의 독보적인 선도 업체였던 Scale AI는 Meta가 회사에 막대한 투자를 하고 CEO를 영입한 뒤, OpenAI와 Google가 Scale을 고객에서 제외하면서 상당한 도전에 직면했습니다. 이로 인해 Surge와 Mercor와 같은 경쟁 업체들이 시장 점유율을 확대할 기회를 얻게 되었습니다.


업계 관계자들에 따르면, RL 환경에 대한 투자는 AI 시스템의 학습 방식에 근본적인 변화를 가져오고 있습니다. Surge의 CEO인 에드윈 첸(Edwin Chen)은 “OpenAI와 Anthropic이 자신들의 모델을 개선하는 방식은 실제로 인간의 학습 과정을 모방하고 있으며, 강화 학습 환경은 AI가 실제 세계에서 살아가는 것과 같다”고 설명했습니다.


도전과 회의론


막대한 투자에도 불구하고, 상당한 기술 및 사업적 과제들이 여전히 남아 있습니다. 비평가들은 AI 모델이 실제로 의도한 작업을 수행하지 않고 보상을 얻기 위한 허점을 찾아내는 “보상 해킹”과 같은 문제를 지적합니다. 환경 자체에는 긍정적 입장을 보이면서도, Andrej Karpathy는 강화 학습에 대해서는 신중한 태도를 보이며 “강화 학습에만 한정해선 부정적 시각을 갖고 있다”고 언급했습니다.


업계의 공감대는 RL 환경이 차세대 AI 에이전트 개발에 핵심적이며, OpenAI의 o1 모델 및 Anthropic의 Claude 시스템 등 최근의 혁신을 가능하게 했다고 봅니다. 하지만 이러한 환경에서 지능을 추출하는 최적의 방법과 확장성에 관한 의문이 연구자와 투자자들 사이에서 끊임없이 논쟁을 불러일으키고 있습니다.

댓글 0
전체 407 / 1 페이지
Spotify가 AI 가 제작한 것으로 보이는 음원 7500만 개를 삭제 했다고 발표했다.그리고 AI 음악 금지 정책을 발표하고, 이에 대한 과감한 규제를 시작한다고.———더 강력한 사칭 규칙문제: 우리는 항상 기만적인 콘텐츠에 대한 정책을 가지고 있었습니다. 하지만 AI 도구는 당신이 좋아하는 아티스트의 보컬 딥페이크를 그 어느 때보다 쉽게 생성할 수 있게 해주었습니다.우리가 발표하는 것: 우리는 AI 음성 복제(및 기타 형태의 승인되지 않은 음성 사칭)에 대한 클레임을 처리하는 방법을 명확히 하는 새로운 사칭 정책을 도입하여 아티스트에게 더 강력한 보호와 더 명확한 의지를 제공합니다. 보컬 사칭은 사칭 아티스트가 사용을 승인한 경우에만 Spotify의 음악에서 허용됩니다.우리는 또한 업로더가 스트리밍 서비스를 통해 다른 아티스트의 프로필에 음악을 사기로 전달하는 또 다른 사칭 전술(AI 생성 또는 기타)로부터 보호하기 위해 투자를 늘리고 있습니다. 우리는 주요 아티스트 유통업체와 함께 새로운 예방 전술을 테스트하여 소스에서 이러한 공격을 더 잘 막을 수 있도록 준비하고 있습니다. 우리 쪽에서는 콘텐츠 불일치 프로세스에 더 많은 자원을 투자하여 검토 대기 시간을 줄이고 아티스트가 출시 전 상태에서도 "불일치"를 보고할 수 있도록 할 것입니다.
5 조회
0 추천
19:22 등록
(퍼플렉시티가 정리한 기사)삼성전자가 15일 '흰지팡이의 날'을 맞아 시각장애인과 저시력자를 위한 인공지능(AI) 가전 매뉴얼 '모두를 위한 사용법'을 공개했다고 발표했다. 이번 발표는 시각장애인의 가전제품 접근성을 획기적으로 개선하기 위한 포용적 기술 혁신의 일환이다.스타트업과의 협업으로 탄생한 혁신삼성전자는 올해 초 'C랩 아웃사이드' 스타트업 육성 프로그램에 선정된 시각보조앱 개발 스타트업 투아트(TUAT)와 협업해 이 매뉴얼을 개발했다. 투아트는 200여 개 이상의 국가에서 활용되는 AI 기반 시각보조앱 '설리번 플러스'를 제작한 회사로, 이미지 묘사와 문자 읽기 등 다양한 서비스를 제공하고 있다.새로운 매뉴얼은 삼성닷컴과 AI 기반 시각보조앱 '설리번 플러스'에서 확인할 수 있으며, 화면 읽기 기능과 하단 재생버튼을 통한 음성 설명을 제공한다.혁신적인 접근성 기능들매뉴얼의 가장 큰 특징은 제품 외관과 조작부 위치를 "눈앞에 그리듯" 상세하게 설명한다는 점이다. 예를 들어 '비스포크 AI 콤보' 세탁건조기의 먼지필터 청소 시 기존 매뉴얼이 그림으로 표현했던 것을 "세탁기 전면부 상단 오른쪽 모서리에 먼지필터 도어가 있습니다"와 같이 구체적으로 안내한다.부품 외관도 "손바닥보다 조금 큰 사이즈의 문이 먼지필터 도어입니다"처럼 촉각적 경험에 기반한 설명을 포함했다. 또한 음성인식 Q&A 기능을 탑재해 필요한 정보를 빠르게 찾을 수 있도록 했으며, 시각장애인을 위한 촉각 스티커 부착 위치도 안내한다.단계적 확대와 미래 계획매뉴얼은 2024년형과 2025년형 비스포크 AI 콤보 세탁건조기, 인피니트 AI 콤보 세탁건조기, 비스포크 AI 원바디 세탁기·건조기, 비스포크 AI 세탁기와 비스포크 AI 건조기 등 6개 제품에 우선 제공된다. 한국어 버전으로 시작해 향후 스페인어, 영어, 프랑스어를 포함한 20개 언어로 확대될 예정이다.양혜순 삼성전자 생활가전(DA)사업부 부사장은 "모든 사용자가 삼성 제품을 불편함 없이 사용할 수 있도록 접근성을 지속적으로 개선해 나갈 것"이라며 "앞으로도 혁신 기술과 사회적 가치를 결합해 더 나은 사용자 경험을 제공하겠다"고 밝혔다.흰지팡이의 날은 1980년 세계시각장애인연합회가 시각장애인들의 권리를 보호하고 사회적 관심을 이끌어내기 위해 제정한 기념일이다.
6 조회
0 추천
18:32 등록
(퍼플렉시티가 정리한 기사)아마존이 인공지능 분야에 대한 투자를 가속화함에 따라 인사(HR) 부서의 최대 15%를 감원할 준비를 하고 있다고 이 사안에 정통한 소식통이 화요일 밝혔다. 이번 감원은 전 세계적으로 1만 명이 넘는 인력을 보유하고 채용, HR 기술, 직원 지원 기능을 담당하는 회사의 People eXperience and Technology(PXT) 부서를 주로 대상으로 한다.이 같은 인력 감축은 앤디 재시 CEO가 올해 인공지능 인프라와 클라우드 컴퓨팅 역량에 1,000억 달러 이상을 쏟아붓는 동시에, 기업 인건비를 줄이기 위한 대대적인 전략의 최신 단계로 평가된다. 아마존의 핵심 소비자 사업 부문에서도 추가적인 감원이 예상되지만, 정확한 규모와 시기는 아직 명확하지 않다.AI 기반 인력 혁신이번 해고는 자시(Jassy)가 6월에 직원들에게 AI 도입으로 인해 회사 전반에 걸쳐 인력 감축이 있을 것이라고 경고한 메모에 따른 것이다. "AI를 회사 전체에 광범위하게 활용하면 효율성이 높아져 전체 기업 인력이 감축될 것으로 예상합니다,"라고 자시는 적었으며, 직원들에게 기술적 변화를 받아들이지 않으면 뒤처질 위험이 있다고 강조했다.아마존은 이미 역사상 최대 규모의 인력 감축을 단행했으며, 2022년 말부터 2023년 사이에 약 27,000개의 기업 직무를 없앴다. 이번 감축은 전통적인 성과 기반 감축과 달리, 아마존의 장기 AI 전환에 따른 전략적 구조조정이라는 점에서 차이가 있다.회사의 대규모 AI 투자는 내부 운영을 지원하고 기업 고객에게 서비스를 제공하기 위한 미래형 데이터 센터 구축을 포함한다. 아마존 웹 서비스는 자사의 AI 사업이 현재 수십억 달러 규모로 성장하고 있으며, 세 자릿수 성장률을 기록하고 있다고 밝혔다.휴일 채용, 전략적 변화 강조아마존이 휴일 시즌을 맞아 미국 전역의 창고와 물류 네트워크에서 25만 명의 임시직 근로자를 채용하겠다고 발표한 것과 동시에, 기업 정리해고가 뚜렷한 대조를 이룹니다. 시간당 평균 19달러 이상의 임금을 받는 이 임시직들은 지난 2년과 같은 수준의 채용 규모를 보이며, 회사가 휴일 수요 증가에 대비하고 있음을 보여줍니다.이러한 상반된 접근 방식은 아마존이 변화하는 인력 전략—화이트칼라 일자리 감축과 일선 운영 유지는 병행—을 추구하고 있음을 강조합니다. 이러한 조치는 회사가 트럼프 대통령의 관세 정책 아래에서의 경제적 불확실성을 헤쳐 나가면서, 마이크로소프트, 알파벳 등 경쟁사와의 AI 및 클라우드 컴퓨팅 분야 경쟁 우위 유지를 위해 분투하는 가운데 이루어지고 있습니다.업계 분석가들은 아마존의 이러한 접근 방식을 빅테크 전반의 광범위한 트렌드를 반영하는 것으로 보고 있습니다. 즉, 기업들이 선별적인 정리해고를 단행하는 한편, 미래 성장과 효율성을 이끌 AI 역량에 막대한 투자를 하고 있다는 뜻입니다.
6 조회
0 추천
18:30 등록
(퍼플렉시티가 정리한 기사)AMD는 월요일 산호세에서 열린 Open Compute Project Global Summit에서 Helios 랙 규모 AI 플랫폼을 공개하며, AI 인프라 시장에서 Nvidia의 지배력에 대한 과감한 도전을 알렸습니다. 이 발표는 Oracle이 2026년 3분기부터 50,000개의 AMD Instinct MI450 GPU를 배포하기로 약속하며 첫 주요 고객이 된 것과 동시에 이루어졌습니다.Helios 플랫폼은 급속도로 확장되는 AI 데이터 센터 시장에서 경쟁하기 위한 AMD의 가장 야심찬 노력을 나타내며, Meta의 새로운 Open Rack Wide 사양을 활용하여 Nvidia의 차기 Vera Rubin 아키텍처보다 50% 더 많은 메모리 용량을 제공한다고 회사는 주장합니다. 각 Helios 랙은 72개의 MI450 GPU를 탑재하고 있으며, 31TB의 HBM4 메모리와 1.4 PB/s의 총 대역폭으로 최대 1.4 엑사플롭스의 FP8 성능을 제공합니다.오라클 파트너십은 주요 검증을 의미합니다업계 분석가들에 따르면 약 35억~40억 달러 규모로 평가되는 오라클과의 계약은 AMD의 AI 전략에 대한 중요한 검증을 의미합니다. 오라클 클라우드 인프라스트럭처는 MI450 프로세서로 구동되는 최초의 공개 이용 가능한 AI 슈퍼클러스터의 일환으로 50,000개의 GPU를 배치할 예정이며, 2027년 이후 확장 계획을 가지고 있습니다."고객들은 극한의 확장성과 효율성을 위해 설계된 적응 가능하고 개방적인 컴퓨팅 솔루션을 필요로 합니다"라고 오라클은 파트너십 발표에서 밝혔습니다. 이번 배치는 MI450 GPU와 차세대 EPYC "Venice" CPU, 그리고 Pensando "Vulcano" 네트워킹 기술을 결합한 AMD의 통합 Helios 랙 디자인을 활용할 것입니다.AMD의 주가는 이번 발표 이후 시간외 거래에서 3% 이상 상승했으며, 이는 주로 회사의 최근 AI 파트너십에 힘입어 올해 85% 상승한 것에 더해진 것입니다. 오라클과의 계약은 AMD가 수년간 6기가와트의 GPU 용량을 제공하기로 OpenAI와 수십억 달러 규모의 계약을 체결한 지 불과 일주일 만에 이루어졌습니다.Nvidia 생태계에 대한 개방형 표준 도전Helios 플랫폼은 Nvidia의 독점 생태계에 대한 대안으로 개방형 표준을 촉진하는 AMD의 전략을 구현합니다. 기가와트 규모의 데이터 센터에 최적화된 더블 와이드 랙을 정의하는 Meta의 Open Rack Wide 사양을 기반으로 구축된 Helios는 UALink 및 Ultra Ethernet Consortium 아키텍처를 포함한 개방형 컴퓨팅 표준을 통합합니다.AMD 데이터 센터 솔루션 부문 수석 부사장인 Forrest Norrod는 "개방형 협업은 AI를 효율적으로 확장하는 핵심입니다"라고 말했습니다. "Helios를 통해 우리는 개방형 표준을 실제 배포 가능한 시스템으로 전환하고 있습니다".각 MI450 GPU는 최대 432GB의 HBM4 메모리와 19.6 TB/s의 메모리 대역폭을 제공하여 AMD에게 메모리 집약적인 AI 워크로드에서 잠재적인 이점을 제공합니다. 이 플랫폼은 또한 AMD가 이전 세대 대비 17.9배 높은 성능을 제공하며 Nvidia의 경쟁 시스템인 Vera Rubin과 비교하여 우수한 메모리 사양을 제공한다고 설명합니다.
6 조회
0 추천
18:29 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입