Loading...

AI 뉴스

AI 기업들, 에이전트 훈련 위해 RL환경에 막대한 투자

페이지 정보

작성자 xtalfi
작성일 2025.09.18 02:43
798 조회
0 추천
0 비추천

본문

ca0c201d210a9aa7767c3b612bfe399edvaM.png

(퍼플렉시티가 정리한 기사)

주요 AI 기업들은 보다 능력 있는 AI 에이전트를 만들기 위해 강화학습 환경에 전례 없는 투자를 쏟아붓고 있으며, Anthropic은 내년에 이러한 정교한 훈련 플랫폼에 10억 달러 이상을 지출할 계획이라고 전해졌다. 이 대규모 자금 지원은 실리콘밸리에서 기존 AI 훈련 방식이 한계에 도달했으며, 진정으로 자율적인 AI 시스템을 개발하려면 새로운 접근이 필요하다는 인식이 커지고 있음을 보여준다.


강화학습 환경은 AI 에이전트가 단순히 텍스트를 처리하는 것보다 실제로 행동하면서 학습할 수 있는 시뮬레이션 작업 공간 역할을 한다. 2025년 9월에 보고된 바에 따르면, 이러한 가상 훈련장은 AI 에이전트가 소프트웨어 애플리케이션을 탐색하거나 Salesforce를 통해 고객 관계를 관리하거나, 의료 시스템에서 의료 기록을 처리하는 등 복잡한 과업을 연습할 수 있게 해준다. 이전 세대 AI를 구동했던 고정된 데이터셋과 달리, 이러한 동적 환경은 실시간 피드백을 제공하고 예측할 수 없는 에이전트의 행동에 맞춰 적응한다.


스타트업들이 수요에 부응하기 위해 서두르고 있다


수요의 급증으로 인해 잘 자금이 지원된 신생 스타트업들이 RL(강화 학습) 환경 제공의 패권을 차지하기 위해 경쟁하는 새로운 카테고리가 탄생했습니다. 모든 직업의 자동화를 대담하게 목표로 지난해 6개월 전에 설립된 메카나이즈 워크(Mechanize Work)는 AI 코딩 에이전트를 위한 고도화된 훈련 환경을 구축하기 위해 소프트웨어 엔지니어에게 연봉 50만 달러를 제안하고 있습니다. 소식통에 따르면 이 스타트업은 이미 Anthropic과 RL 프로젝트를 진행 중이라고 합니다.


저명한 AI 연구원 안드레이 카파시(Andrej Karpathy)와 파운더스 펀드(Founders Fund)가 지원하는 프라임 인텔렉트(Prime Intellect)는 “RL 환경을 위한 허깅페이스(Hugging Face)“를 자처하며, 2025년 8월에 출시된 오픈소스 플랫폼으로 소규모 개발자들을 겨냥하고 있습니다. 이 회사는 2025년 3월에 1,500만 달러의 자금을 조달하며 이러한 강력한 훈련 도구에 대한 접근을 민주화하는 것을 목표로 하고 있습니다.


기존 데이터 라벨링 업체들도 이 기회를 포착하기 위해 전략을 수정하고 있습니다. 지난해 12억 달러의 매출을 올린 것으로 알려진 서지 AI(Surge AI)는 AI 연구소의 수요 증가에 대응해 RL 환경 구축을 위한 전담 내부 조직을 만들었습니다. 연간화 매출 4억 5천만 달러와 100억 달러 가치로 투자를 유치 중인 머커(Mercor)는 코딩, 헬스케어, 법률 등 분야별 환경을 개발하고 있습니다.


시장 경쟁이 심화된다


경쟁 구도는 기업들이 이 신흥 분야에서 우위를 차지하기 위해 치열한 경쟁을 벌이면서 점점 더 치열해지고 있습니다. 한때 AI 데이터 라벨링 분야의 독보적인 선도 업체였던 Scale AI는 Meta가 회사에 막대한 투자를 하고 CEO를 영입한 뒤, OpenAI와 Google가 Scale을 고객에서 제외하면서 상당한 도전에 직면했습니다. 이로 인해 Surge와 Mercor와 같은 경쟁 업체들이 시장 점유율을 확대할 기회를 얻게 되었습니다.


업계 관계자들에 따르면, RL 환경에 대한 투자는 AI 시스템의 학습 방식에 근본적인 변화를 가져오고 있습니다. Surge의 CEO인 에드윈 첸(Edwin Chen)은 “OpenAI와 Anthropic이 자신들의 모델을 개선하는 방식은 실제로 인간의 학습 과정을 모방하고 있으며, 강화 학습 환경은 AI가 실제 세계에서 살아가는 것과 같다”고 설명했습니다.


도전과 회의론


막대한 투자에도 불구하고, 상당한 기술 및 사업적 과제들이 여전히 남아 있습니다. 비평가들은 AI 모델이 실제로 의도한 작업을 수행하지 않고 보상을 얻기 위한 허점을 찾아내는 “보상 해킹”과 같은 문제를 지적합니다. 환경 자체에는 긍정적 입장을 보이면서도, Andrej Karpathy는 강화 학습에 대해서는 신중한 태도를 보이며 “강화 학습에만 한정해선 부정적 시각을 갖고 있다”고 언급했습니다.


업계의 공감대는 RL 환경이 차세대 AI 에이전트 개발에 핵심적이며, OpenAI의 o1 모델 및 Anthropic의 Claude 시스템 등 최근의 혁신을 가능하게 했다고 봅니다. 하지만 이러한 환경에서 지능을 추출하는 최적의 방법과 확장성에 관한 의문이 연구자와 투자자들 사이에서 끊임없이 논쟁을 불러일으키고 있습니다.

댓글 0
전체 663 / 100 페이지
(퍼플렉시티가 정리한 기사)SK텔레콤 이 AI 사업을 총괄하는 사내회사(CIC) 출범을 발표하며 2030년 연매출 5조원 달성을 목표로 5년간 5조원을 투자한다고 밝혔다. 유영상 CEO가 25일 전 구성원 대상 타운홀 미팅을 열고 이같은 내용을 발표했다.AI CIC 조직 체계와 목표AI CIC는 에이닷(A.) 서비스, 기업용 에이닷 비즈, AI 데이터센터 사업, 글로벌 AI 제휴투자, AI R&D, 메시징·인증 사업 등 전사 AI 관련 기능과 조직을 통합해 운영된다. 유영상 CEO가 직접 AI CIC 대표를 겸임하며, 세부 조직 개편은 10월 말 시행될 예정이다.유 CEO는 “급변하는 AI 환경 변화에 따라 위기와 기회가 공존하는 AI 골든타임을 놓치지 않기 위해서는 수요자 관점의 내부 AI 혁신과 공급자 관점의 AI 사업 혁신이 필요하다”며 AI CIC 출범 배경을 설명했다.사업 전략과 성과 기반AI CIC는 AI 수요(B2C, B2B)와 공급(AI 인프라)의 안정적 선순환을 통해 독자 생존 가능한 수익 구조를 확보할 계획이다. B2C는 에이닷을 중심으로 국내외 가입자 기반을 확대하고, B2B는 에이전틱 AI 서비스를 통한 생산성 향상 입증과 제조 AI 분야 레퍼런스 확보에 집중한다.SK텔레콤은 지난 3년간 AI 컴퍼니 전환을 통해 에이닷 1000만 가입자 확보, 독자 AI 파운데이션 모델 선정, 울산 AI DC 착수, 글로벌 파트너십 구축 등의 성과를 달성했다고 발표했다. 에이닷은 정식 출시 22개월 만에 가입자 1000만명을 돌파했으며, 월간 활성사용자수(MAU)는 약 810만명에 달한다.울산 AI 데이터센터의 경우 7조원을 투자해 축구장 11개 규모의 연면적 2만평 이상으로 건설되며, 6만장 가량의 GPU를 수용할 수 있는 국내 최대 규모의 AI 전용 하이퍼스케일 데이터센터로 2027년 말부터 단계적 가동을 시작할 예정이다.
702 조회
0 추천
2025.09.25 등록
(퍼플렉시티가 정리한 기사)삼성전자 가 자체 개발한 AI 업무 생산성 측정 지표 ’트루벤치(TRUEBench)’를 25일 공개하며, 기존 영어 중심 벤치마크의 한계를 극복한 실무 환경 기반 평가 도구를 선보였다.실무 환경 반영한 차별화된 평가 지표트루벤치는 삼성전자 DX부문 선행 연구개발조직인 삼성리서치가 사내 생성형 AI 모델 적용 경험을 바탕으로 개발한 벤치마크다. 기존 AI 벤치마크 대부분이 영어 중심이고 한 번 또는 제한된 횟수의 대화만을 평가해 실제 업무 생산성 성능을 정확히 측정하기 어렵다는 문제를 해결하기 위해 만들어졌다.실제 평가 항목은 10개 카테고리, 46개 업무, 2,485개의 세분화된 항목으로 구성됐다. 콘텐츠 생성, 데이터 분석, 문서 요약 및 번역, 연속 대화 등 기업에서 자주 사용하는 실제 오피스 업무 체크리스트를 기반으로 완성됐다. 사용자의 짧은 요청부터 최대 2만자의 긴 문서 요약까지 실제 업무 상황을 폭넓게 평가한다.다국어 지원과 글로벌 접근성트루벤치는 영어, 한국어, 일본어, 중국어, 스페인어 등 총 12개 언어를 지원한다. 특히 글로벌 비즈니스 환경을 고려해 영어와 한국어 등 여러 언어가 혼합된 교차 언어의 번역 기능 평가도 가능하다. 사용자는 한 번에 최대 5개 모델을 선택해 비교할 수 있어 다양한 AI 모델의 성능을 한눈에 파악할 수 있으며, 응답 결과에 대한 평균 길이 등도 공개해 성능과 효율성 지표를 동시에 비교할 수 있다.삼성전자는 글로벌 오픈소스 플랫폼 허깅페이스(Hugging Face)에 트루벤치의 데이터 샘플과 AI 모델들의 평가 결과가 표시된 리더보드를 공개했다.AI 교차 검증으로 객관성 확보트루벤치는 답변의 정확성뿐만 아니라, 겉으로 드러나지 않는 사용자의 의도나 맥락까지 평가가 가능하도록 설계됐다. 평가 항목 검증에는 AI가 활용되는데, 사람이 구축한 평가 기준을 AI가 검토해 오류나 모순, 불필요한 제약이 없는지 확인하며 지속적인 교차 검증의 반복을 통해 더욱 정교한 평가 기준을 완성한다. 이러한 기준으로 완성된 AI 모델 자동 평가는 주관적 편향을 최소화하고 일관성 있는 결과를 제공한다.전경훈 DX부문 최고기술책임자(CTO) 겸 삼성리서치장 사장은 “삼성 리서치는 다양한 실제 적용 사례를 바탕으로 차별화된 생산성 AI 기술 경쟁력과 노하우를 보유하고 있다”며 “트루벤치 공개를 통해 생산성 성능 평가 기준을 정립하고 삼성전자의 기술 리더십을 더욱 공고히 할 것”이라고 말했다.
709 조회
0 추천
2025.09.25 등록
(퍼플렉시티가 정리한 기사)구글 는 오늘 Mixboard를 공개했습니다. 이 AI 기반 무드보드 애플리케이션은 시각적 영감 도구 분야에서 Pinterest 의 지배력에 직접적으로 도전장을 내밀었습니다. 실험적인 이 서비스는 미국에서 Google Labs를 통해 공개 베타로 제공되며, 사용자는 기존 이미지를 수동으로 선별하는 대신 텍스트 프롬프트를 활용해 시각적 콘셉트 보드를 만들 수 있습니다.Pinterest가 저장된 이미지를 수집 및 정리하는 전통적인 방식을 사용하는 것과 달리, Mixboard는 구글의 화제를 모은 Nano Banana 이미지 편집 모델을 활용해 “보헤미안 거실 인테리어”나 “가을 모임 테마” 같은 간단한 설명만으로도 완전히 새로운 이미지를 생성할 수 있습니다. 이후 사용자는 자연어 명령을 사용하여 이미지를 결합하거나 스타일을 조정하거나, 한 번의 클릭만으로 콘텐츠를 재생성하는 등 AI가 생성한 보드를 더욱 정교하게 다듬을 수 있습니다.구글의 AI 모멘텀, 핀터레스트 영역에 도전하다Mixboard의 출시는 구글의 최근 소비자 AI 도입 붐을 적극적으로 활용한 것입니다. 구글의 Gemini 앱은 Nano Banana 기능에 대한 열풍에 힘입어 9월에 애플 앱스토어와 구글 플레이스토어 모두에서 ChatGPT를 제치고 최고 순위 애플리케이션에 올랐습니다. 구글에 따르면 Nano Banana는 2주 만에 2,300만 명의 신규 사용자를 끌어모았고, 5억 건이 넘는 이미지 편집에 활용되었습니다.이러한 모멘텀 덕분에 Mixboard는 Pinterest의 핵심 비즈니스 모델에 중요한 위협으로 자리매김하고 있습니다. Pinterest가 기존 이미지를 사용자가 직접 발견하고 저장하는 방식으로 플랫폼을 구축한 반면, Mixboard는 AI 생성을 통해 그 큐레이션 과정을 완전히 없앱니다. 이 도구는 홈 데코 계획, 행사 테마, DIY 프로젝트 등과 같이 유사한 활용 사례를 타깃으로 하지만, 사용자가 먼저 이미지 라이브러리를 구축할 필요 없이 즉각적인 시각적 결과를 제공합니다.기술 혁신이 창의적인 워크플로우와 만나다Mixboard는 사용자가 “Nano Banana”라는 별명을 붙인 구글의 Gemini 2.5 Flash Image 모델을 통합하여, 대화형 인터페이스를 통한 정교한 이미지 편집 기능을 제공합니다. 이 플랫폼은 사용자가 개인 이미지를 AI가 생성한 콘텐츠와 함께 업로드할 수 있도록 지원하여, 사용자 자산과 알고리즘이 생성한 시각적 요소가 혼합된 하이브리드 보드를 만들 수 있습니다.이 서비스는 또한 보드 이미지를 기반으로 설명 텍스트를 생성하여, 사용자가 협업자나 클라이언트와 공유할 창의적 개념을 명확히 표현하는 데 도움을 줍니다. 구글은 이 도구가 기존에 물리적 또는 Pinterest 기반의 무드 보드를 활용해 프로젝트를 기획해왔던 사진작가, 디자이너, 크리에이티브 전문가들에게 특히 가치 있는 도구라고 소개합니다.구글은 서비스가 실험 단계(labs.google/mixboard)에 있는 동안 전용 Discord 커뮤니티를 통해 사용자 피드백을 수집하고 있습니다.
664 조회
0 추천
2025.09.25 등록
(퍼플렉시티가 정리한 기사)이재명 대통령은 수요일, 대한민국 대통령으로는 최초로 유엔 안전보장이사회 회의를 주재함으로써 역사적인 순간을 만들었다. 그는 국제안보에 대한 인공지능의 증대하는 위협에 관한 전례 없는 글로벌 토론을 이끌었다. 뉴욕 유엔 본부에서 열린 공개 토론에는 세계 정상, 인공지능 전문가, 외교관들이 모여 인류가 직면한 가장 시급한 기술적 도전 중 하나를 함께 논의했다.안토니우 구테흐스 유엔 사무총장은 인공지능의 무기화 가능성에 대해 강력한 경고를 전하며, 15개 이사국에게 “최근 분쟁은 인공지능을 활용한 타격과 자율성의 시험장이 되고 있다”고 말했다. 그는 치명적인 자율 무기 시스템에 대한 전 세계적 금지를 재차 촉구하면서 “인류의 운명을 알고리즘에게 맡길 수 없다”며 “생명과 죽음의 결정에서는 인간이 반드시 권한을 유지해야 한다”고 강조했다.대한민국, 글로벌 AI 거버넌스 선도이 대표가 이번 회의를 주재한 것은 9월 한국이 유엔 안보리 의장국을 맡으면서 마련한 대표적 행사였다. 이 대표는 모인 대표들에게 인공지능(AI)이 경제 침체와 기후 변화와 같은 도전을 극복하는 데 인류를 도울 수도 있지만, “‘아이언 커튼’을 뛰어넘는 ‘실리콘 커튼’이 되어 전 세계적으로 불평등과 불균형을 심화시킬 수도 있다”고 경고했다.AI 선구자 제프리 힌턴이 현재의 AI를 “아주 귀여운 호랑이 새끼”로 비유한 것을 인용해, 이 대표는 이 기술이 “우리를 잡아먹는 사나운 포식자가 될 수도 있고, K팝 데몬헌터즈에 나오는 사랑스러운 캐릭터 더피(Derpy)가 될 수도 있다”고 말했다. 그는 “유일하게 현실적이고 현명한 선택은 국익을 위해 경쟁하되, 인류의 이익을 위해 협력하는 것”이라고 강조했다.한국은 국제 AI 거버넌스 노력의 선두에 나서, 네덜란드와 함께 유엔 최초의 군사 AI 관련 결의안을 공동제안하고, AI 서울 서밋을 개최해 ‘안전성, 혁신, 포용성’을 강조하는 서울 선언문을 발표했다. 이 대표는 다음 아시아태평양경제협력체(APEC) 정상회의 의장국으로서, 전 세계적으로 AI가 인류의 번영에 기여하도록 하는 세계적 이니셔티브를 선보이겠다고 밝혔다.국제 협력에 대한 긴급한 요청토론은 인공지능(AI) 역량이 기하급수적으로 확장되고 있는 중요한 시점에서 이루어지고 있습니다. 영국 부총리 데이비드 래미는 위원회에 연설하면서 변화의 속도를 “번개와 같다”고 표현하며, “초지능이 수평선 위에 나타나고 있으며, 우리의 행동을 대신해 운영, 조정, 그리고 행동할 수 있게 될 것”이라고 경고했습니다.전문가 브리핑 중 한 명인 스탠퍼드 대학교의 최예진 교수는 AI 개발이 “소수의 기업과 나라”에 집중되고 있다는 우려를 강조하며, 대표단들에게 “소수만이 AI를 구축하고 그 혜택을 누릴 자원을 가지고 있다면, 우리는 나머지 세계를 문밖에 세워두는 꼴이 된다”고 말했습니다. 그녀는 AI 기술에 대한 접근성을 확대하고, AI 시스템 내 언어적·문화적 다양성을 확보할 것을 촉구했습니다.구테흐스 사무총장은 전 세계적 대응을 위한 네 가지 우선 과제를 제시했습니다: 무기 시스템에 대한 인간의 통제 유지, 일관된 규제 체계 구축, 정보의 진실성 보호, 그리고 부유한 나라와 가난한 나라 사이의 “AI 역량 격차” 해소. 그는 “우리가 AI를 평화, 정의, 인류를 위해 형성할 수 있는 기회의 창이 닫히고 있다”며 즉각적인 행동을 촉구했습니다.안보리 회의는 전 세계적 AI 거버넌스 메커니즘 구축을 위한 유엔의 보다 넓은 노력이 이루어지는 가운데 진행되었습니다. 여기에는 AI 거버넌스에 관한 글로벌 대화의 시작과, AI에 대한 독립적인 국제 과학 위원회 설립이 포함됩니다. 이러한 이니셔티브들은 AI 개발과 배치를 전 세계적으로 규제하기 위한 유엔의 가장 포괄적인 시도를 대표합니다.
628 조회
0 추천
2025.09.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입