Loading...

AI 뉴스

AI 기업들, 에이전트 훈련 위해 RL환경에 막대한 투자

페이지 정보

작성자 xtalfi
작성일 2025.09.18 02:43
414 조회
0 추천
0 비추천

본문

ca0c201d210a9aa7767c3b612bfe399edvaM.png

(퍼플렉시티가 정리한 기사)

주요 AI 기업들은 보다 능력 있는 AI 에이전트를 만들기 위해 강화학습 환경에 전례 없는 투자를 쏟아붓고 있으며, Anthropic은 내년에 이러한 정교한 훈련 플랫폼에 10억 달러 이상을 지출할 계획이라고 전해졌다. 이 대규모 자금 지원은 실리콘밸리에서 기존 AI 훈련 방식이 한계에 도달했으며, 진정으로 자율적인 AI 시스템을 개발하려면 새로운 접근이 필요하다는 인식이 커지고 있음을 보여준다.


강화학습 환경은 AI 에이전트가 단순히 텍스트를 처리하는 것보다 실제로 행동하면서 학습할 수 있는 시뮬레이션 작업 공간 역할을 한다. 2025년 9월에 보고된 바에 따르면, 이러한 가상 훈련장은 AI 에이전트가 소프트웨어 애플리케이션을 탐색하거나 Salesforce를 통해 고객 관계를 관리하거나, 의료 시스템에서 의료 기록을 처리하는 등 복잡한 과업을 연습할 수 있게 해준다. 이전 세대 AI를 구동했던 고정된 데이터셋과 달리, 이러한 동적 환경은 실시간 피드백을 제공하고 예측할 수 없는 에이전트의 행동에 맞춰 적응한다.


스타트업들이 수요에 부응하기 위해 서두르고 있다


수요의 급증으로 인해 잘 자금이 지원된 신생 스타트업들이 RL(강화 학습) 환경 제공의 패권을 차지하기 위해 경쟁하는 새로운 카테고리가 탄생했습니다. 모든 직업의 자동화를 대담하게 목표로 지난해 6개월 전에 설립된 메카나이즈 워크(Mechanize Work)는 AI 코딩 에이전트를 위한 고도화된 훈련 환경을 구축하기 위해 소프트웨어 엔지니어에게 연봉 50만 달러를 제안하고 있습니다. 소식통에 따르면 이 스타트업은 이미 Anthropic과 RL 프로젝트를 진행 중이라고 합니다.


저명한 AI 연구원 안드레이 카파시(Andrej Karpathy)와 파운더스 펀드(Founders Fund)가 지원하는 프라임 인텔렉트(Prime Intellect)는 “RL 환경을 위한 허깅페이스(Hugging Face)“를 자처하며, 2025년 8월에 출시된 오픈소스 플랫폼으로 소규모 개발자들을 겨냥하고 있습니다. 이 회사는 2025년 3월에 1,500만 달러의 자금을 조달하며 이러한 강력한 훈련 도구에 대한 접근을 민주화하는 것을 목표로 하고 있습니다.


기존 데이터 라벨링 업체들도 이 기회를 포착하기 위해 전략을 수정하고 있습니다. 지난해 12억 달러의 매출을 올린 것으로 알려진 서지 AI(Surge AI)는 AI 연구소의 수요 증가에 대응해 RL 환경 구축을 위한 전담 내부 조직을 만들었습니다. 연간화 매출 4억 5천만 달러와 100억 달러 가치로 투자를 유치 중인 머커(Mercor)는 코딩, 헬스케어, 법률 등 분야별 환경을 개발하고 있습니다.


시장 경쟁이 심화된다


경쟁 구도는 기업들이 이 신흥 분야에서 우위를 차지하기 위해 치열한 경쟁을 벌이면서 점점 더 치열해지고 있습니다. 한때 AI 데이터 라벨링 분야의 독보적인 선도 업체였던 Scale AI는 Meta가 회사에 막대한 투자를 하고 CEO를 영입한 뒤, OpenAI와 Google가 Scale을 고객에서 제외하면서 상당한 도전에 직면했습니다. 이로 인해 Surge와 Mercor와 같은 경쟁 업체들이 시장 점유율을 확대할 기회를 얻게 되었습니다.


업계 관계자들에 따르면, RL 환경에 대한 투자는 AI 시스템의 학습 방식에 근본적인 변화를 가져오고 있습니다. Surge의 CEO인 에드윈 첸(Edwin Chen)은 “OpenAI와 Anthropic이 자신들의 모델을 개선하는 방식은 실제로 인간의 학습 과정을 모방하고 있으며, 강화 학습 환경은 AI가 실제 세계에서 살아가는 것과 같다”고 설명했습니다.


도전과 회의론


막대한 투자에도 불구하고, 상당한 기술 및 사업적 과제들이 여전히 남아 있습니다. 비평가들은 AI 모델이 실제로 의도한 작업을 수행하지 않고 보상을 얻기 위한 허점을 찾아내는 “보상 해킹”과 같은 문제를 지적합니다. 환경 자체에는 긍정적 입장을 보이면서도, Andrej Karpathy는 강화 학습에 대해서는 신중한 태도를 보이며 “강화 학습에만 한정해선 부정적 시각을 갖고 있다”고 언급했습니다.


업계의 공감대는 RL 환경이 차세대 AI 에이전트 개발에 핵심적이며, OpenAI의 o1 모델 및 Anthropic의 Claude 시스템 등 최근의 혁신을 가능하게 했다고 봅니다. 하지만 이러한 환경에서 지능을 추출하는 최적의 방법과 확장성에 관한 의문이 연구자와 투자자들 사이에서 끊임없이 논쟁을 불러일으키고 있습니다.

댓글 0
전체 446 / 56 페이지
(퍼플렉시티가 정리한 기사)Adobe는 Luma AI의 첨단 Ray3 비디오 생성 모델을 Firefly 플랫폼에 통합하여 회사의 AI 기반 크리에이티브 생태계를 크게 확장했습니다. 이번 파트너십을 통해 Adobe 고객들은 Luma AI가 최초의 추론 역량을 갖춘 비디오 AI 모델이라고 주장하는 Ray3를 독점적으로 조기 접근할 수 있게 되었으며, 이는 앞으로 2주 동안 Adobe Firefly와 Luma의 Dream Machine 플랫폼에서만 이용 가능합니다.Ray3 모델은 AI 비디오 생성 기술의 획기적인 발전을 보여주며, Luma AI가 설명한 바와 같이, 자신의 결과물을 평가하고 개선할 수 있는 멀티모달 추론 시스템을 적용하고 있습니다. Luma AI의 CEO이자 공동 창립자인 Amit Jain에 따르면, “Ray3는 이러한 부분을 획기적으로 바꿨습니다. 획기적인 추론 시스템 덕분에 의도를 이해하고, 자체 결과를 평가하며, 결과를 개선할 수 있어, 생성된 비디오의 정확성과 품질이 크게 향상됩니다.”기술 역량 및 전문적 응용Ray3는 10비트, 12비트, 16비트 ACES2065-1 EXR 포맷의 네이티브 고명암비(HDR)를 지원하는 최초의 비디오 AI 모델로 차별화되며, 이는 전문적인 영화 및 광고 파이프라인에 적합하게 만듭니다. 이 모델은 이전 모델에 비해 향상된 캐릭터 일관성과 자연스러운 동작, 그리고 개선된 물리 시뮬레이션을 통해 최대 10초 길이의 시네마틱 품질의 비디오 클립을 생성합니다.이 통합은 다양한 사용 사례를 통해 콘텐츠 제작자와 전문 영화 제작자 모두를 지원합니다. 콘텐츠 제작자는 Firefly의 텍스트-투-비디오(Text to Video) 기능을 활용하여 소셜 미디어 플랫폼용 배경 영상과 전환 영상을 생성할 수 있으며, 영화 제작자는 Firefly Boards에서 사전 제작 기획 단계에서 시각적 방향, 환경 및 샷 구성 등을 탐색하는 데 사용할 수 있습니다.어도비의 AI 접근 방식의 전략적 전환이 파트너십은 Adobe의 AI 전략에서 주목할 만한 진화를 보여줍니다. 처음에는 독점적으로 라이선스가 있는 콘텐츠로 훈련된 자체 Firefly 모델에 집중했던 Adobe는 2025년 내내 점차적으로 외부의 서드파티 AI 모델에도 플랫폼을 개방해왔습니다. 이제 Adobe는 OpenAI, Google, Black Forest Labs, Runway, Pika, Ideogram 등 다양한 업체의 모델을 자사 솔루션과 함께 통합하고 있습니다.Adobe의 신생 GenAI 사업 부문 부사장 Hannah Elsakr는 회사의 비전을 강조했습니다: “Adobe는 Adobe Firefly를 통해 미래의 창의적인 AI 생태계를 구축하고 있습니다. Firefly는 업계의 최고 수준 창의적 AI 모델에 접근할 수 있는 올인원 목적지입니다”. 이 접근 방식은 사용자가 하나의 구독으로 다수의 AI 모델을 이용할 수 있게 하면서도, Adobe가 AI로 생성된 콘텐츠의 투명성을 위해 추진하는 Content Credentials에 대한 약속을 유지합니다.시장 영향 및 향후 시사점이번 협업을 통해 양사는 급변하는 AI 비디오 생성 시장에서 구글의 Veo, Runway AI 및 기타 신흥 플랫폼들과의 경쟁에서 더 효과적으로 맞설 수 있게 되었습니다. Adobe는 출시 프로모션의 일환으로 10월 1일까지 유료 Firefly 및 Creative Cloud Pro 고객에게 무제한 Ray3 생성을 제공하고 있습니다.Firefly에서 Ray3로 생성된 모든 콘텐츠는 Creative Cloud 계정에 동기화되어 Premiere Pro와 같은 전문 애플리케이션에서 편집할 수 있으며, 이를 통해 Adobe의 에코시스템 전략을 정의해온 통합 워크플로우 접근 방식을 유지합니다.
390 조회
0 추천
2025.09.19 등록
(퍼플렉시티가 정리한 기사)메타는 자사의 인공지능 제품에 사용할 뉴스 콘텐츠를 확보하기 위해 주요 미디어 기관들과 라이선스 계약 체결을 적극적으로 추진하고 있으며, 이는 콘텐츠 파트너십에 대한 회사의 접근 방식에 큰 변화를 나타내는 것으로, AI 경쟁사들과의 경쟁에서 앞서기 위한 움직임이다.소셜 미디어 거대기업인 메타는 Axel Springer, Fox Corp, News Corp 등 유수의 미디어 기업들과 자사의 기사와 뉴스 콘텐츠를 메타의 AI 도구에 통합하기 위한 라이선스 계약에 관해 논의해왔다. 수개월 동안 진행된 이 대화들은 주로 뉴스 및 추가 콘텐츠의 라이선스 취득에 초점을 맞추고 있으며, 이는 메타의 다양한 AI 서비스 전반에 활용될 예정이다.하지만 이 사안에 정통한 업계 관계자들은 일부 논의가 아직 초기 단계에 머물러 있으며, 공식 계약으로 이어지지 않을 수도 있다고 경고한다. 관련 미디어 기업들의 대변인들은 대부분 언급을 거부했으며, 메타, 뉴스 코퍼레이션, 그리고 폭스 측도 로이터의 논평 요청에 답하지 않았다.슈퍼인텔리전스 랩스에서의 전략적 전환라이선스 추진은 메타가 최근 주요 인사들의 이탈과 최신 오픈소스 Llama 4 모델에 대한 미온적인 반응 이후, 새로운 조직인 ‘Meta Superintelligence Labs’ 하에 AI 이니셔티브를 재편하는 과정에서 이루어지고 있습니다. 이번 재편으로 메타의 모든 AI 팀은 한 부서로 통합되었으며, Scale AI의 전 CEO였던 알렉산더 왕이 메타의 최고 AI 책임자로 팀을 이끌게 되었습니다.메타의 새로운 AI 전략은 콘텐츠 라이선싱에 대한 기존 입장에서 벗어난다는 점을 보여줍니다. 메타는 그동안 경쟁사들에 비해 AI 라이선싱 계약 건수가 훨씬 적었으며, 2024년 Reuters와 실시간 뉴스 콘텐츠 제휴를 맺은 바 있습니다. 이러한 제한적인 접근 방식은 다수의 주요 언론사와 라이선싱 계약을 체결한 OpenAI나, 제프 베조스가 지원하는 Perplexity가 여러 뉴스 매체와 광범위한 협력을 이루고 있다는 점에서 뚜렷한 대조를 이룹니다.경쟁 환경이 더욱 치열해지고 있다미디어 라이선스 논의는 AI 산업의 더 광범위한 경쟁 역학을 반영하며, 고품질의 최신 콘텐츠 접근이 AI 모델을 훈련하고 개선하는 데 필수적이 되었다. OpenAI는 The Financial Times, Associated Press, Vox Media, 그리고 The Atlantic을 포함한 출판사들과 협력을 맺었다. 이와 유사하게, 아마존 역시 The New York Times와 협력하여 Alexa와 같은 AI 애플리케이션에서 편집 콘텐츠를 사용할 수 있도록 했다.출판사들은 메타(Meta)의 AI 크롤러가 보상 없이 자신의 콘텐츠에 접근하는 것을 점점 더 차단하고 있다. 주요 언론사의 robots.txt 파일을 검토한 결과, The Guardian, Washington Post, Financial Times, New York Times, 그리고 News UK 모두 메타의 주요 Llama 크롤러를 차단하고 있음을 알 수 있다. 이는 구글와 대조된다. 출판사들은 검색 트래픽 순위에 미칠 잠재적 영향을 우려해 구글은 차단을 꺼리고 있다.업계 수익 분배의 진화AI 콘텐츠 라이선싱 환경은 점점 더 정교한 수익 공유 모델로 진화하고 있습니다. Perplexity는 최근 AI가 생성한 응답에서 콘텐츠가 참조될 때 게시자에게 보상하는 4,250만 달러 규모의 수익 분배 프로그램을 출시했습니다. 이 접근 방식에는 웹사이트 직접 방문, 검색 인용, AI 에이전트 행동에 대한 비용 지급이 포함됩니다.Meta가 본격적인 라이선싱 논의에 참여한 것은 프리미엄 뉴스 콘텐츠 접근성이 AI 시장에서 효과적으로 경쟁하는 데 필수적임을 인정한 신호입니다. 한 출판사 임원이 “AI는 좋은 콘텐츠로 운영된다”고 언급했듯이, Superintelligence Labs가 이끄는 Meta의 새로운 리더십은 기존 AI 전략보다 이 점을 더 명확하게 인식하고 있습니다.이러한 라이선스 협상의 결과는 Meta의 AI 역량은 물론, 기술 플랫폼과 뉴스 퍼블리셔 간의 보다 넓은 관계에도 상당한 영향을 미칠 수 있습니다. 업계가 AI 훈련 및 배포에 사용되는 콘텐츠에 대한 공정한 보상 문제를 지속적으로 논의하고 있기 때문입니다.
397 조회
0 추천
2025.09.19 등록
(퍼플렉시티가 정리한 기사)스탠퍼드 대학교와 비영리 기관인 아크 연구소의 과학자들은 인공지능(AI)을 활용해 기능성 박테리아 살균 바이러스 16종을 성공적으로 개발하며 합성 생물학 분야에 획기적인 진전을 이뤄냈다. 이 성과는 치료적 잠재력에 대한 기대감과 가능한 위험성에 대한 경고를 동시에 불러일으키고 있다.아크 연구소의 브라이언 히가 이끄는 연구팀은 Evo 1과 Evo 2라는 정교한 AI 모델을 사용해 박테리오파지(특정 박테리아를 공격하는 바이러스)의 전체 유전체를 설계했다. MIT 테크놀로지 리뷰에 따르면, 이번 연구 결과는 화요일 사전 논문(preprint)으로 공개됐으며, 이는 “완전한 유전체의 최초 생성적 설계”가 이루어진 사례로 평가된다.AI가 유전자 코드를 작성하는 법을 배우다연구진은 약 200만 개의 박테리오파지 유전체를 이용해 AI 시스템을 훈련시켰으며, 이를 통해 바이러스 DNA 서열에서 패턴을 인식하도록 학습시켰다. 연구팀은 11개의 유전자와 약 5,000개의 뉴클레오티드만을 가진 단순한 바이러스인 phiX174의 변이체를 만드는 데에 집중했다. 이는 더 큰 생명체에서 발견되는 복잡성의 일부에 불과하다.화학적으로 합성된 후 실험실 조건에서 테스트된 302개의 AI 생성 유전체 설계 중 16개가 생존 가능한 것으로 판명되었다. 이 인공 바이러스들은 성공적으로 복제되어 대장균(E. coli) 박테리아를 죽였으며, 일부는 자연 바이러스보다 뛰어난 성능을 보였다. “실제로 이 AI가 생성한 구체를 보는 것은 매우 인상적이었습니다,“라고 히에(Hie)는 MIT 테크놀로지 리뷰에 말하며, 연구진이 박테리아가 죽은 뚜렷한 영역을 관찰한 순간을 설명했다.안전 문제 대두이 돌파구에 대해 저명한 과학자들은 신중한 반응을 보이고 있다. 최초의 합성 DNA 생물체를 만드는 데 기여한 J. 크레이그 벤터(J. Craig Venter)는 이 기술의 잠재적 오용에 대해 경고했다. MIT 테크놀로지 리뷰와 뉴스위크의 연구 보도에 따르면 벤터는 “특히 임의적이고 예측 불가능한 바이러스 증강에 관한 연구에 대해서는 극도의 신중함을 강하게 촉구한다”고 말했다.연구진은 인공지능 훈련 데이터에서 인간에 감염되는 바이러스를 의도적으로 제외했으나, 전문가들은 다른 이들이 이처럼 자제하지 않을 수 있다고 우려하고 있다. 이 기술이 더 위험한 병원체에 적용될 수 있는 잠재력을 지니고 있기 때문에, 유전체 설계 역량의 민주화가 생물보안에 대한 우려를 불러일으키고 있다.치유적 약속안전 경고에도 불구하고, 이 연구는 항생제 내성 감염 해결에 대한 가능성을 보여줍니다. 박테리오파지 요법—유해 박테리아를 죽이는 바이러스를 사용하는 치료법—은 기존 항생제가 점점 효과가 떨어짐에 따라 다시 관심을 받고 있습니다. AI로 생성된 바이러스는 기존 약에 더 이상 반응하지 않는 박테리아 감염 치료제로 개발될 잠재력이 있습니다.다수의 AI로 설계된 파지는 실험실 경쟁에서 자연 발생 phiX174 바이러스보다 더 높은 적합도를 보여주었으며, 생성된 바이러스 칵테일은 세 종류의 E. coli 균주에서 박테리아 내성을 신속하게 극복해 파지 치료 적용 가능성을 입증했습니다.연구를 검토한 NYU 랑곤 헬스의 생물학자 제프 보에크는 AI로 설계된 생명체를 향한 “눈에 띄는 첫걸음”이라고 평하면서, AI가 “새로운 유전자, 짧아진 유전자, 그리고 다양하게 배열된 유전자 서열까지” 만들어냈다는 점을 지적했습니다.이 연구는 인공지능과 합성생물학의 교차점에서 중요한 발전을 이루었지만, 연구자들은 더 복잡한 생명체를 만드는 것은 현 기술로는 아직 크게 멀었다는 점을 인정합니다.
399 조회
0 추천
2025.09.18 등록
(퍼플렉시티가 정리한 기사)이탈리아 의회는 수요일에 획기적인 인공지능 입법을 통과시켜, 이탈리아가 유럽연합 회원국 중 최초로 EU의 AI Act에 부합하는 포괄적인 AI 규제를 시행하는 국가가 되었습니다. 조르자 멜로니 총리 정부는 인간 중심적이고 투명하며 안전한 AI 사용의 기본 원칙을 확립하는 동시에 혁신, 사이버보안 및 개인정보 보호를 강조하는 이 광범위한 입법을 주도했습니다.이 법은 만 14세 미만 아동의 AI 접근에 엄격한 요구 사항을 부과하며, 어떠한 AI 시스템 사용에도 부모의 동의를 의무화합니다. 이 조항은 미성년자가 AI 기술에 노출되어 발생할 수 있는 아동 발달과 개인정보에 대한 잠재적 영향을 우려하는 목소리에 대응하기 위한 것입니다.형사 처벌, 인공지능 남용 겨냥이 법안은 특히 딥페이크를 포함한 AI 생성 콘텐츠의 불법 유포에 대해 엄격한 형사 처벌을 도입합니다. 범죄자는 그로 인해 피해가 발생할 경우 1년에서 5년까지의 징역형에 처해질 수 있습니다. AI를 이용한 사기, 신원 도용, 시장 조작 또는 자금 세탁은 가중 처벌 사유로 간주되어 형량이 최대 3분의 1까지 늘어날 수 있습니다.“이 법은 혁신을 공공의 이익이라는 테두리 안으로 다시 불러들이며, AI가 성장과 권리, 시민의 완전한 보호를 향해 나아가도록 이끕니다.“라고 디지털 전환 담당 차관인 알레시오 부티가 말했습니다.정부 감독 구조정부는 이탈리아 디지털 기관과 국가 사이버보안 기관을 AI 개발 및 구현을 감독하는 주요 국가 당국으로 지정했습니다. 이탈리아 중앙은행과 시장 규제 기관 Consob을 포함한 기존의 금융 감독 기관들은 각자의 영역 내에서 감독 권한을 유지합니다.이 법은 의료, 고용, 공공 행정, 사법, 교육, 스포츠 등 여러 분야를 아우르는 규정을 도입하여 AI의 의사결정 과정에 대한 추적 가능성과 인간의 감독을 요구합니다.투자 및 혁신 지원이탈리아는 인공지능, 사이버 보안, 양자 기술 및 통신에 관련된 중소기업과 대기업에 대한 지분 투자를 위해 국가가 지원하는 벤처 캐피탈 펀드에서 최대 10억 유로를 배정했습니다. 그러나 비평가들은 이 금액이 미국과 중국과 같은 경쟁국들이 투자하는 규모에 비해 미미하다고 주장합니다.이 법안에는 업종별 규칙이 포함되어 있으며, AI가 진단 및 치료를 지원하는 경우에도 의료 전문인이 궁극적인 의사 결정을 내려야 한다는 요구사항 등이 명시되어 있습니다. 또한, 작업장에서 AI 기술이 도입될 경우 고용주는 근로자에게 반드시 이를 알려야 합니다.
360 조회
0 추천
2025.09.18 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입