AI 뉴스

AI 기업들, 에이전트 훈련 위해 RL환경에 막대한 투자

페이지 정보

작성자 xtalfi
작성일 2025.09.18 02:43
848 조회
0 추천
0 비추천

본문

ca0c201d210a9aa7767c3b612bfe399edvaM.png

(퍼플렉시티가 정리한 기사)

주요 AI 기업들은 보다 능력 있는 AI 에이전트를 만들기 위해 강화학습 환경에 전례 없는 투자를 쏟아붓고 있으며, Anthropic은 내년에 이러한 정교한 훈련 플랫폼에 10억 달러 이상을 지출할 계획이라고 전해졌다. 이 대규모 자금 지원은 실리콘밸리에서 기존 AI 훈련 방식이 한계에 도달했으며, 진정으로 자율적인 AI 시스템을 개발하려면 새로운 접근이 필요하다는 인식이 커지고 있음을 보여준다.


강화학습 환경은 AI 에이전트가 단순히 텍스트를 처리하는 것보다 실제로 행동하면서 학습할 수 있는 시뮬레이션 작업 공간 역할을 한다. 2025년 9월에 보고된 바에 따르면, 이러한 가상 훈련장은 AI 에이전트가 소프트웨어 애플리케이션을 탐색하거나 Salesforce를 통해 고객 관계를 관리하거나, 의료 시스템에서 의료 기록을 처리하는 등 복잡한 과업을 연습할 수 있게 해준다. 이전 세대 AI를 구동했던 고정된 데이터셋과 달리, 이러한 동적 환경은 실시간 피드백을 제공하고 예측할 수 없는 에이전트의 행동에 맞춰 적응한다.


스타트업들이 수요에 부응하기 위해 서두르고 있다


수요의 급증으로 인해 잘 자금이 지원된 신생 스타트업들이 RL(강화 학습) 환경 제공의 패권을 차지하기 위해 경쟁하는 새로운 카테고리가 탄생했습니다. 모든 직업의 자동화를 대담하게 목표로 지난해 6개월 전에 설립된 메카나이즈 워크(Mechanize Work)는 AI 코딩 에이전트를 위한 고도화된 훈련 환경을 구축하기 위해 소프트웨어 엔지니어에게 연봉 50만 달러를 제안하고 있습니다. 소식통에 따르면 이 스타트업은 이미 Anthropic과 RL 프로젝트를 진행 중이라고 합니다.


저명한 AI 연구원 안드레이 카파시(Andrej Karpathy)와 파운더스 펀드(Founders Fund)가 지원하는 프라임 인텔렉트(Prime Intellect)는 “RL 환경을 위한 허깅페이스(Hugging Face)“를 자처하며, 2025년 8월에 출시된 오픈소스 플랫폼으로 소규모 개발자들을 겨냥하고 있습니다. 이 회사는 2025년 3월에 1,500만 달러의 자금을 조달하며 이러한 강력한 훈련 도구에 대한 접근을 민주화하는 것을 목표로 하고 있습니다.


기존 데이터 라벨링 업체들도 이 기회를 포착하기 위해 전략을 수정하고 있습니다. 지난해 12억 달러의 매출을 올린 것으로 알려진 서지 AI(Surge AI)는 AI 연구소의 수요 증가에 대응해 RL 환경 구축을 위한 전담 내부 조직을 만들었습니다. 연간화 매출 4억 5천만 달러와 100억 달러 가치로 투자를 유치 중인 머커(Mercor)는 코딩, 헬스케어, 법률 등 분야별 환경을 개발하고 있습니다.


시장 경쟁이 심화된다


경쟁 구도는 기업들이 이 신흥 분야에서 우위를 차지하기 위해 치열한 경쟁을 벌이면서 점점 더 치열해지고 있습니다. 한때 AI 데이터 라벨링 분야의 독보적인 선도 업체였던 Scale AI는 Meta가 회사에 막대한 투자를 하고 CEO를 영입한 뒤, OpenAI와 Google가 Scale을 고객에서 제외하면서 상당한 도전에 직면했습니다. 이로 인해 Surge와 Mercor와 같은 경쟁 업체들이 시장 점유율을 확대할 기회를 얻게 되었습니다.


업계 관계자들에 따르면, RL 환경에 대한 투자는 AI 시스템의 학습 방식에 근본적인 변화를 가져오고 있습니다. Surge의 CEO인 에드윈 첸(Edwin Chen)은 “OpenAI와 Anthropic이 자신들의 모델을 개선하는 방식은 실제로 인간의 학습 과정을 모방하고 있으며, 강화 학습 환경은 AI가 실제 세계에서 살아가는 것과 같다”고 설명했습니다.


도전과 회의론


막대한 투자에도 불구하고, 상당한 기술 및 사업적 과제들이 여전히 남아 있습니다. 비평가들은 AI 모델이 실제로 의도한 작업을 수행하지 않고 보상을 얻기 위한 허점을 찾아내는 “보상 해킹”과 같은 문제를 지적합니다. 환경 자체에는 긍정적 입장을 보이면서도, Andrej Karpathy는 강화 학습에 대해서는 신중한 태도를 보이며 “강화 학습에만 한정해선 부정적 시각을 갖고 있다”고 언급했습니다.


업계의 공감대는 RL 환경이 차세대 AI 에이전트 개발에 핵심적이며, OpenAI의 o1 모델 및 Anthropic의 Claude 시스템 등 최근의 혁신을 가능하게 했다고 봅니다. 하지만 이러한 환경에서 지능을 추출하는 최적의 방법과 확장성에 관한 의문이 연구자와 투자자들 사이에서 끊임없이 논쟁을 불러일으키고 있습니다.

댓글 0
전체 723 / 116 페이지
(퍼플렉시티가 정리한 기사)오늘 공개된 Google Cloud의 최신 DORA 연구 보고서에 따르면, 인공지능 도구의 소프트웨어 개발자들 사이의 광범위한 도입률이 2025년에는 놀랍게도 90%에 달한다고 합니다. 이는 전년 대비 14%의 급격한 증가를 나타내며, AI가 현대 소프트웨어 개발에서 거의 보편적인 존재로 자리 잡았음을 보여줍니다.전 세계 약 5,000명의 기술 전문가 설문 응답을 바탕으로 한 연례 “AI 지원 소프트웨어 개발 현황(State of AI-assisted Software Development)” 보고서에 따르면, 개발자들은 이제 하루 평균 두 시간씩 AI 기반 작업에 투자하며, 코드 생성부터 테스트 및 보안 리뷰에 이르기까지 핵심 워크플로우에 이러한 도구들을 통합하고 있습니다.Google의 연구팀은 조사 대상 전문가의 65%가 소프트웨어 개발 작업에 AI에 크게 의존하고 있다고 밝혔습니다.생산성 향상이 대중적 채택을 이끈다AI 도입의 급증은 상당한 생산성 이점에 의해 주도되고 있는 것으로 보이며, 응답자의 80% 이상이 AI가 업무 효율성을 향상시켰다고 답했습니다. 또한 59%는 코드 품질에 긍정적인 영향을 보고하여 이러한 도구들이 단순한 속도 향상을 넘어 측정 가능한 개선을 제공한다고 시사합니다.구글의 Gemini Code Assist를 포함한 코딩 도구를 총괄하는 Ryan Salva는 구글의 “대다수” 팀이 워크플로우에 AI를 도입하고 있다고 언급했습니다. 그는 CNN과의 인터뷰에서 “구글의 엔지니어라면 매일의 업무에서 AI를 사용하는 것은 피할 수 없는 일”이라고 전했습니다.구글 CEO 순다 피차이는 올해 초, AI 도구들이 구글 엔지니어링 팀의 생산성을 10% 향상시켰다고 공개했으며, 현재 회사의 신규 코드 중 25% 이상이 AI 시스템에 의해 생성되고 있다고 밝혔습니다.많은 이용에도 불구하고 신뢰는 여전히 완고하게 낮다광범위하게 도입되고 보고된 이점에도 불구하고, 상당한 신뢰 격차가 여전히 존재합니다. 개발자의 24%만이 AI가 생성한 코드에 대해 높은 신뢰를 표명하고 있으며, 20%는 “많이” 신뢰한다고, 4%는 “매우 많이” 신뢰한다고 답했습니다. 반면 30%는 AI의 출력 결과를 “약간” 또는 “전혀” 신뢰하지 않는다고 응답했습니다.이러한 “신뢰의 역설”은 AI가 인간의 판단을 대체하기보다는 주로 보조 도구로 활용되고 있음을 나타냅니다. 이 결과는 업계의 더 넓은 동향과도 일치하는데, Stack Overflow의 2025년 설문조사에 따르면 개발자의 46%가 AI 출력의 정확성을 신뢰하지 않는다고 답했으며, 이는 전년도 31%에서 크게 증가한 수치입니다.산업 전반에 걸친 도전 과제 등장급속한 AI 통합은 초급 소프트웨어 엔지니어들에게 어려운 시기에 발생하고 있습니다. 뉴욕 연방준비은행에 따르면, 최근 컴퓨터 공학 졸업생들의 실업률이 이제 예술사나 영어와 같은 전공보다 더 높아졌습니다. Indeed의 소프트웨어 엔지니어링 직무 공고는 2022년 2월부터 2025년 8월까지 71% 감소했습니다.구현상의 어려움을 해결하기 위해 구글은 DORA AI 역량 모델을 도입하여, AI의 조직적 영향력을 증대시키는 일곱 가지 기술적 및 문화적 실천법을 제시했습니다. 이 프레임워크는 성공적인 AI 도입을 위해 사용자 중심의 초점, 명확한 소통 프로토콜, 그리고 소규모 일괄 작업 방식을 필수 요소로 강조합니다.Salva는 AI가 개발 속도를 가속화하더라도 소프트웨어 품질 유지를 위해 팀에는 여전히 견고한 피드백 메커니즘이 필요하다고 경고했습니다. 그는 “AI의 도움을 받는다고 해도, 팀은 이루어지고 있는 코드 변경사항에 대해 빠른 피드백을 받을 수 있는 방법이 여전히 필요합니다.”라고 말했습니다.연구 결과에 따르면, AI의 궁극적인 영향력은 도입률보다는 조직이 AI 지원 개발이 효과적으로 자리 잡을 수 있는 적절한 기술적 및 문화적 환경을 조성하는 능력에 더 달려 있는 것으로 나타납니다.
711 조회
0 추천
2025.09.24 등록
(퍼플렉시티가 정리한 기사)애플는 9월 22일 iOS 26.1의 첫 번째 개발자 베타 버전을 출시하며, 아이폰이 AI 시스템, 서드파티 웨어러블, 보안 위협과 상호작용하는 방식을 혁신할 수 있는 여러 기능을 선보였습니다. 이 업데이트는 iOS 26이 공개된 지 단 일주일 만에 공개되었으며, 인공지능 통합 강화와 더 넓은 기기 호환성을 통해 애플이 자사 생태계 역량 확장을 위해 노력하고 있다는 신호입니다.AI에 대한 접근성이 더욱 보편화된다iOS 26.1 베타의 가장 중요한 발전은 모델 컨텍스트 프로토콜(MCP)에 대한 지원입니다. MCP는 써드파티 AI 어시스턴트인 ChatGPT와 Gemini가 아이폰 앱과 직접 상호작용할 수 있게 해주는 표준화된 프레임워크입니다.9to5Mac에서 발견한 코드에 따르면, 애플은 App Intents 프레임워크에 MCP 지원을 통합하고 있습니다.MCP는 원래 Anthropic에서 개발되었으나, 현재는 OpenAI와 Google도 채택하고 있어 다양한 AI 시스템과 데이터 소스 간의 보편적인 다리 역할을 합니다. 이론적으로 사용자는 외부 AI 어시스턴트에게 여러 아이폰 앱의 정보를 액세스하거나, Siri가 App Intents를 통해 동작하듯 다양한 작업을 대신 수행하도록 명령할 수 있게 됩니다.이번 업데이트는 애플 인텔리전스가 번체 중국어, 덴마크어, 네덜란드어, 노르웨이어, 포르투갈어, 스웨덴어, 터키어, 베트남어 등 8개의 새로운 언어로 확대됩니다. 에어팟용 실시간 번역(Live Translation) 기능은 일본어, 한국어, 그리고 간체 및 번체 중국어도 새롭게 지원합니다.타사 스마트워치 호환성 등장iOS 26.1 베타에는 Apple이 비-Apple 스마트워치와의 iPhone 호환성을 개선하기 위해 기능을 개발 중임을 시사하는 코드가 포함되어 있습니다. 이 베타 버전에는 iPhone 알림을 서드파티 기기에서 표시할 수 있는 “알림 전달(Notification Forwarding)” 기능에 대한 참조가 포함되어 있습니다.첨부된 문서의 조사 결과에 따르면, 이 기능은 “한 번에 하나의 액세서리”로만 알림을 보낼 수 있게 하며, 이를 활성화하면 Apple Watch에서의 알림이 비활성화됩니다. 또한, 이 베타 버전은 “AccessoryExtension”으로 라벨된 새로운 액세서리 페어링 프레임워크를 공개하지만, 이는 아직 초기 개발 단계에 있는 것으로 보입니다.보안 업데이트가 중단됨Apple은 iOS 26.1에서 “신속 보안 대응(Rapid Security Response)” 시스템의 명칭을 “백그라운드 보안 개선(Background Security Improvements)“으로 변경하고 있습니다. 새로운 시스템은 사용자의 개입 없이 자동으로 보안 패치를 설치하여, 설정 앱을 통해 수동으로 다운로드할 필요를 없앱니다.포브스(Forbes)에 따르면, 이러한 백그라운드 개선은 “더 신속하게” 사용자들을 보안 취약점으로부터 보호하는 것이 목표이며, 여기에는 “실제로 악용되고 있는” 위협도 포함됩니다. 또한 패치로 인해 호환성 문제가 발생할 경우를 대비해 롤백(rollback) 기능도 함께 제공할 예정입니다.인터페이스 개선 및 성능 수정베타 버전은 여러 사용자 인터페이스 요소를 개선하며, 논란이 많은 Liquid Glass 디자인을 Phone 앱의 키패드에 적용합니다. Photos 앱은 업데이트된 비디오 스크러버 인터페이스를 받고, Calendar 앱은 이제 이벤트에 대해 전체 너비의 컬러 하이라이트를 표시합니다.Apple Music은 제스처 컨트롤이 추가되어, 사용자가 미니 플레이어에서 좌우로 스와이프하여 곡을 변경할 수 있습니다. 이번 업데이트는 Face ID로 잠금 해제 중 발생하던 Apple Watch의 지속적인 Wi-Fi 연결 끊김 문제도 해결합니다.iOS 26.1은 10월에 공식 출시될 예정이며, MCP 지원이나 서드파티 스마트워치 호환성과 같은 일부 기능은 이후 업데이트에서 제공될 수 있습니다. 알림 전달 기능은 출시될 경우 규제 요건으로 인해 유럽연합(EU) 사용자를 대상으로 우선 적용될 가능성이 있습니다.
726 조회
0 추천
2025.09.24 등록
(퍼플렉시티가 정리한 기사)엔씨소프트 AI 계열사 NC AI가 오는 25일 도쿄게임쇼 2025에서 자체 개발한 바르코 기반 생성형 AI 솔루션을 선보인다고 23일 발표했다. 국내 AI 기업 중 최초로 도쿄게임쇼에 공식 진출하는 NC AI는 이번 전시를 통해 글로벌 게임 시장 진출을 본격화한다.게임 제작 시간 혁신하는 바르코 AI 시리즈 공개NC AI가 도쿄게임쇼에서 공개할 주요 솔루션은 ‘바르코 3D’, ‘바르코 싱크페이스’, ‘바르코 사운드’ 등 3종이다. 가장 주목받는 ‘바르코 3D’는 텍스트나 이미지 입력만으로도 3D 모델을 자동 생성하는 기술이다. 메시와 텍스처를 동시에 제작할 수 있으며, 자동 리메시, 텍스처 수정 및 편집, 리깅과 애니메이션 연동까지 지원하여 복잡한 3D 제작 공정을 대폭 간소화한다.특히 바르코 3D는 기존 4주 이상 걸리던 3D 제작 과정을 10분 이내로 단축시킬 수 있어 게임 개발 효율성을 극대화하는 것으로 평가받고 있다. 게임 제작뿐만 아니라 VR, AR 같은 차세대 플랫폼 환경에도 즉시 적용 가능하다.멀티모달 AI 기술로 게임 제작 전 과정 지원바르코 싱크페이스는 음성만으로 캐릭터의 립싱크, 표정, 감정까지 실시간 자동 생성하는 AI 기술이다. 한국어, 영어, 일본어 등 다국어를 지원하며, 대규모 언어모델(LLM)과 멀티모달 프레임워크 기반으로 캐릭터가 상황에 맞춰 자연스러운 표정과 감정 흐름을 표현한다.바르코 사운드는 텍스트나 이미지 입력을 기반으로 배경음악, 효과음, 캐릭터 사운드 등을 자동 생성하는 멀티모달 오디오 AI 기술이다. 사운드 제작자가 찾기 힘든 독창적인 음향을 빠르게 만들어낼 수 있어, 기존 데이터베이스 기반 AI보다 폭넓은 사운드 제작이 가능하다.글로벌 기술력 입증과 상용화 협업 추진이번에 공개되는 기술들은 과학기술정보통신부와 정보통신기획평가원(IITP)이 지원하는 생성AI 선도 인재 양성 사업의 결과물이다. 도쿄게임쇼에서의 피드백을 반영해 국내 AI 인재 양성을 위한 교재로도 활용될 예정이다.NC AI는 도쿄게임쇼 참가를 계기로 일본 현지 인디게임사, 게임 관련 학과, 글로벌 대형 퍼블리셔들과 교류를 강화하고 연구 협업 및 상용 프로젝트를 구체적으로 추진할 계획이다.임수진 NC AI 최고사업책임자(CBO)는 “게임 AI는 이제 단순한 보조 도구가 아니라 창작자가 새로운 상상력을 현실로 구현할 수 있게 하는 파트너가 되고 있다”며 “바르코 AI 시리즈를 통해 전 세계 개발자들에게 혁신적이고 효율적인 제작 환경을 제공하고, 글로벌 게임 산업 혁신의 핵심 주체로 자리매김할 것”이라고 밝혔다.
703 조회
0 추천
2025.09.23 등록
(퍼플렉시티가 정리한 기사)세계 최대 자산운용사 블랙록의 래리 핑크 최고경영자가 22일 뉴욕에서 이재명 대통령과 만나 한국을 아시아·태평양 지역의 AI 수도로 만들기 위한 대규모 투자 협력 방안에 합의했다. 양측은 AI 및 재생에너지 분야 협력을 위한 업무협약(MOU)을 체결하고, 수십조원 규모의 투자 검토에 나섰다.래리 핑크와 이 대통령의 만남이재명 대통령은 유엔총회 참석을 위한 뉴욕 방문 첫 일정으로 세계경제포럼 의장이기도 한 래리 핑크 블랙록 최고경영자와 접견했다. 이 자리에는 하정우 대통령실 AI미래기획수석, 차지호 더불어민주당 의원, 김용 전 세계은행 총재 등이 참석했다.핑크 회장은 “AI와 탈탄소 전환은 반드시 함께 진행되는 것이 중요하며, 한국이 아시아의 AI 수도가 될 수 있도록 글로벌 자본을 연계해 적극 협력하겠다”고 밝혔다고 대통령실이 전했다. 이에 이 대통령은 “한국의 아시아·태평양 AI 수도 실현을 위한 협력에 환영의 뜻을 표한다”며 핑크 회장을 한국에 직접 초대했다.MOU 주요 내용과 투자 규모과학기술정보통신부와 블랙록이 체결한 MOU는 국내 AI 및 재생에너지 인프라 협력, 한국 내 아시아·태평양 AI 허브 구축, 글로벌 협력 구조 마련 등 3가지 핵심 방향을 담고 있다. 특히 재생에너지 기반의 하이퍼스케일 AI 데이터센터를 한국에 구축해 아시아·태평양 지역 전체의 수요를 아우르는 지역 거점으로 발전시키겠다는 계획이 포함됐다.구체적인 투자 규모는 아직 명시되지 않았지만, 차지호 의원은 “블랙록 같은 자산운용사에서 대규모 투자라고 하면 통상 수십조원 단위”라며 “가까운 시일 내 적어도 수조원 단위의 파일럿 투자가 일어날 것으로 예상한다”고 설명했다. 블랙록은 현재 12조 5000억 달러, 한화 약 1경 7000조원 규모의 자산을 운용하는 세계 최대 자산운용사다.향후 협력 방안양측은 한국·블랙록 공동 태스크포스(TF)를 결성해 구체적인 투자 포트폴리오와 실행계획을 논의하기로 했다. 블랙록은 마이크로소프트, 엔비디아, xAI 등과 함께 ’AI 인프라 파트너십(AIP)’을 구성하고 있으며, 한국도 이 파트너십에 참여할 가능성을 열어뒀다.하정우 AI미래기획수석은 “이번 합의가 단순한 투자 유치에 그치지 않고 데이터 관리, 클라우드 서비스, 첨단 연구개발 같은 고부가가치 활동을 한국으로 끌어들이는 자석 역할을 할 것”이라고 기대감을 표했다. 핑크 회장은 “이 대통령의 리더십으로 한국 증시가 사상 최고치를 경신하는 등 정치·경제 상황이 안정화되고 있다”며 한국 투자에 대한 높은 관심을 나타냈다.
703 조회
0 추천
2025.09.23 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입