Loading...

AI 뉴스

기술 기업들, 휴머노이드를 위한 인간 동작 데이터 수집 경쟁

페이지 정보

작성자 xtalfi
작성일 2025.11.02 23:14
2,087 조회
0 추천
0 비추천

본문

c622ee1304a9e86449717f38ef081225_1762092643_5282.png
(퍼플렉시티가 정리한 기사)


인도 남부의 작은 산업 도시에서 나빈 쿠마르는 이마에 고프로 카메라를 장착한 채 수백 번 정밀하게 수건을 접는 일을 하며 하루를 보낸다. 책상 오른쪽에서 수건을 집어 들고, 펴서 바르게 한 다음, 세 번 접어서 왼쪽 구석에 놓는 그의 세심한 작업은 호스피탈리티 교육을 위한 것이 아니다. 이것은 테크 거대 기업들이 AI 기반 휴머노이드 로봇에게 인간처럼 행동하는 방법을 가르치는 데 필요한 물리적 움직임 데이터를 생성하는 것이다.

인간의 움직임을 포착하려는 이러한 전 세계적 노력은 인공지능의 차세대 영역을 대표하며, 기업들이 디지털 AI 숙련도에서 물리적 세계 역량으로 전환하기 위해 서두르고 있다. 테슬라, 보스턴 다이내믹스, 엔비디아를 포함한 주요 테크 기업들은 인간 행동의 방대한 데이터셋을 수집하기 위한 노력을 빠르게 확대하고 있으며, 휴머노이드 로봇 시장은 향후 10년간 380억 달러 규모에 이를 것으로 예상된다.


디지털에서 물리적 AI로

Kumar는 2,000명 이상을 고용하고 있으며 그 중 절반이 로보틱스 및 자율주행 차량 센서 데이터에 집중하고 있는 카루르의 데이터 라벨링 회사 Objectways에서 일하고 있습니다. 그의 팀은 최근 미국 고객에게 200개의 수건 접기 영상을 보냈으며, 영상 섹션 주위에 박스를 그리고 팔이 왼쪽 또는 오른쪽으로 움직였는지를 라벨링하면서 각 동작을 세심하게 주석 처리했습니다.

Objectways와 계약을 맺고 있는 샌프란시스코의 데이터 관리 플랫폼 Encord의 공동 창업자인 Ulrik Stig Hansen은 “기업들이 물리적 세계에 적합한 파운데이션 모델을 구축하고 있습니다”라고 말했습니다. “로보틱스 분야에서 엄청난 부흥이 일어나고 있습니다.”

Tesla는 Optimus 휴머노이드 로봇에 대한 야심찬 생산 목표를 가지고 선두를 달리고 있습니다. 회사는 내부 공장 사용을 위해 2025년에 약 5,000대의 로봇을 생산하는 것을 목표로 하고 있으며, 2026년까지 50,000대 규모로 확대할 계획입니다. CEO Elon Musk는 Optimus를 “역대 최대의 제품”이라고 불렀으며, Tesla는 2026년 초에 Optimus 버전 3의 공개를 목표로 하고 있습니다.


대규모 데이터 수집 노력

인간 움직임 데이터 수집 규모가 전례 없는 수준에 도달했습니다. Figure AI는 2025년 9월 부동산 대기업 Brookfield와 파트너십을 맺고 100,000개 가정 내부의 영상을 촬영했으며, 이는 회사가 “세계에서 가장 크고 다양한 실제 휴머노이드 사전 훈련 데이터셋”이라고 부르는 것을 대표합니다. Brookfield의 5억 평방피트 규모의 상업 공간과 1억 6천만 평방피트 규모의 물류 시설에 걸친 인간 비디오 캡처를 활용하여, Figure는 로봇이 인간 중심 환경을 탐색하도록 가르칠 것입니다.

Scale AI는 샌프란시스코 프로토타입 실험실을 통해 별도로 100,000시간의 훈련 영상을 수집했습니다. 최근 Meta 투자 이후 290억 달러로 평가받는 이 회사는 특히 물리적 AI 애플리케이션을 위해 데이터 엔진을 확장하고 있습니다.

한편, Tesla는 헤드셋과 백팩을 착용한 데이터 수집 팀을 고용하여 테이블 닦기, 차량 부품 정리, 심지어 아기 두뇌 발달 장난감 작업—크기와 색상별로 링 끼우기—과 같은 단순한 작업을 수행하는 자신의 모습을 기록합니다. 작업자들은 일부 작업을 “아기를 가르치는 것”이라고 묘사했으며, 이는 캡처되는 움직임의 기본적인 성격을 강조합니다.


기술적 및 상업적 과제

방대한 데이터 수집에 대한 투자에도 불구하고, 여전히 상당한 과제가 남아 있습니다. 요구되는 정밀도는 값싼 노동력을 투입해도 이러한 작업을 종종 수익성이 없게 만듭니다. 벵갈루루 출신의 20세 데브 만달은 클라이언트가 테이블 색상과 조명 조건까지 정확한 사양을 요구한다는 사실을 알게 된 후 자신의 물리적 AI 데이터 수집 사업을 포기했습니다.

보스턴 다이내믹스와 토요타 리서치 인스티튜트는 최근 아틀라스 휴머노이드 로봇에 대규모 행동 모델(Large Behavior Models)을 적용해 걸음, 웅크림, 들어올리기를 연속 동작으로 결합한 자율적 전신 조작을 시연하며 돌파구를 보였습니다. 그러나 많은 현재의 휴머노이드 시연은 여전히 원격 조정에 크게 의존하고 있어 “실질보다는 보여주기”라는 비판을 받고 있습니다.

업계는 디지털 AI 학습과 비교할 때 “데이터 격차”가 상당하다는 점을 인정하고 있습니다. 언어 모델은 인간이 10만 년 동안 읽어야 할 분량의 텍스트로 학습하는 반면, 물리적 AI는 실제 조작 작업을 위한 이와 비교할 만한 데이터셋이 부족합니다.

1X 같은 기업은 최근 식기세척기 비우기, 식물에 물 주기와 같은 가사 일을 할 수 있는 소비자용 휴머노이드 로봇을 $20,000에 발표했지만, 여전히 복잡한 작업에는 인간의 지원이 필요합니다. 이 회사의 한 직원은 자신들이 훈련시키고 있는 로봇에 대해 이렇게 말합니다. “5년, 10년 후면 이 로봇들이 모든 일을 다 하게 되고, 우리에겐 할 일이 남지 않을 거예요”.

댓글 0
전체 1,366 / 26 페이지
Google DeepMind CEO 데미스 하사비스는 오랫동안 약속되어 온 로봇공학 혁명이 더 이상 미래의 전망이 아니라 현재의 현실이며, 이는 하드웨어 발전이 아닌 인공지능의 돌파구에 의해 주도되고 있다고 선언했습니다. 최근 로봇공학의 현황에 대해 언급하면서 하사비스는 "로봇공학의 병목 현상은 하드웨어가 아니라... 사실 소프트웨어 지능이 항상 로봇공학을 저해해 온 요인이라고 생각한다"고 강조했습니다. 그는 그 병목 현상이 마침내 해소되기 시작했다고 말합니다.​이러한 변화는 파운데이션 모델이 로봇이 학습하고 작동하는 방식을 변화시키면서 나타났습니다. Boston Dynamics의 Atlas 로봇이 이미 2018년에 백플립을 수행하며 놀라운 물리적 능력을 보여주었지만, 이러한 기계들은 특정 작업에만 집중되어 있었습니다. 각 로봇 기능은 기술 이전이나 일반화 없이 별도의 프로그래밍이 필요했습니다—로봇은 상자나 병을 집어 올릴 수 있었지만, 조명이나 방향이 바뀌면 처음부터 다시 시작해야 했습니다.파운데이션 모델은 로봇이 생각할 수 있게 한다파운데이션 모델은 그 패러다임을 다시 작성했습니다. 2025년 3월에 출시된 구글 딥마인드의 제미니 로보틱스와 9월에 출시된 후속작 제미니 로보틱스 1.5는 하사비스가 "명확한 변곡점"이라고 부르는 것을 나타냅니다. 이러한 비전-언어-행동 모델은 로봇이 환경을 인식하고, 다단계 작업을 계획하며, 모든 상황에 대해 수작업으로 코딩된 행동 없이도 자율적으로 실행할 수 있게 합니다.​결정적으로, 이러한 모델은 로봇이 "행동하기 전에 생각"할 수 있게 하여, 복잡한 명령을 일련의 단계로 분해합니다. 제미니 로보틱스 1.5는 색상별로 세탁물을 분류하고, 웹 검색에서 가져온 날씨 예보를 기반으로 여행 가방을 꾸리며, 지역 지침에 따라 재활용품을 분류할 수 있습니다. 이 모든 작업은 사전 프로그래밍된 응답이 아닌 진정한 이해를 필요로 합니다. 또한 이 모델은 서로 다른 로봇 유형 간에 학습을 전이하며, 한 플랫폼에서 학습한 기술이 휴머노이드 로봇을 포함한 다른 플랫폼에 성공적으로 적용됩니다.AGI로 가는 길로서의 체화된 지능Hassabis는 물리적 세계에서 감지하고, 계획하며, 행동할 수 있는 능력인 구현된 지능(embodied intelligence)을 인공 일반 지능(AGI) 달성의 핵심으로 자리매김합니다. "결국 AGI는 이 모든 것을 할 수 있어야 합니다"라고 그는 밝혔습니다. 이는 업계가 로봇공학을 평가하는 방식의 근본적인 전환을 나타내며, 고도로 전문화된 엔지니어링으로 가격을 책정하는 것에서 구현된 AI 시스템으로 취급하는 것으로 이동하고 있습니다.이러한 변화는 개발 일정을 극적으로 가속화하고 있습니다. 수년간의 전문화된 프로그래밍은 훨씬 적은 예제로 적응할 수 있는 범용 모델의 신속한 미세 조정으로 대체되고 있습니다. Google의 2025년 12월 연구 요약에 따르면, 회사는 2025년을 "AI가 우리와 함께 진정으로 생각하고, 행동하며, 세상을 탐험하기 시작한 해"로 규정합니다. 구현된 AI 시장은 이러한 모멘텀을 반영하며, 2025년 44억 4천만 달러에서 2030년까지 230억 6천만 달러로 성장할 것으로 예상됩니다.
862 조회
0 추천
2025.12.27 등록
삼성은 자체 설계한 최초의 그래픽 처리 장치를 성공적으로 개발하여, 이러한 칩 설계가 가능한 전 세계 단 4개 기업과 어깨를 나란히 하게 되는 중요한 성과를 달성했습니다. 12월 18일 삼성의 새로운 Exynos 2600 프로세서에서 공개된 Xclipse 960 GPU는 AMD의 RDNA 아키텍처를 라이선스 하에 사용하고 있지만, 삼성의 System LSI 사업부가 전적으로 자체 개발했다고 한국의 연합뉴스가 보도했습니다.​이번 개발은 삼성의 이전 접근 방식에서 크게 전환된 것을 의미합니다. 2021년 삼성이 GPU 기술을 위해 AMD와 파트너십을 맺은 이후, 두 회사는 Exynos 2200, 2400, 2500 모델을 포함한 Exynos 칩용 그래픽 프로세서를 공동 개발했습니다. Exynos 2600의 경우, 삼성은 AMD의 아키텍처 프레임워크를 계속 사용하면서도 AMD의 직접적인 지원 없이 실제 GPU 칩을 독자적으로 설계하고 엔지니어링했습니다.​삼성의 이번 성과로 인해 회사는 AMD, Intel, Nvidia, Qualcomm에 이어 자체 GPU를 성공적으로 설계한 세계에서 다섯 번째 기업이 되었습니다. 12월 중순 이미 대량 생산에 들어간 Exynos 2600은 2나노미터 제조 공정으로 제작된 세계 최초의 스마트폰 칩입니다. 삼성은 Xclipse 960이 이전 세대 대비 2배의 연산 성능과 50% 향상된 레이 트레이싱 기능을 제공한다고 주장합니다.전략적 투자 및 향후 계획이 이정표를 달성하기 위해 삼성의 반도체 부문은 지난 3년간 연봉 약 20만 7천 달러에서 27만 7천 달러 수준으로 여러 GPU 엔지니어를 채용했습니다. 2025년 11월, 삼성은 AMD와 인텔에서 부사장직을 역임한 베테랑 GPU 전문가 존 레이필드(John Rayfield)를 영입하여 삼성 오스틴 연구센터와 고급 컴퓨팅 연구소를 이끌도록 했습니다.​Exynos 2600은 2026년 1월 말 또는 2월에 출시되는 Galaxy S26 및 S26 Plus 스마트폰에 유럽과 아시아를 포함한 일부 시장에서 탑재될 것으로 예상됩니다. 삼성은 Exynos 2800 칩으로 GPU 독립성을 더욱 강화할 계획인데, 이 칩은 AMD의 아키텍처를 완전히 포기하고 전적으로 독자적인 설계를 채택할 것으로 알려졌습니다. 이 칩은 2028년 Galaxy S28 시리즈에서 데뷔할 수 있습니다.​스마트폰을 넘어 삼성은 자사 GPU 기술을 자율주행 차량 플랫폼, 휴머노이드 로봇, 스마트 안경, AI 애플리케이션용 주문형 반도체(ASIC)에 활용할 계획입니다.
795 조회
0 추천
2025.12.27 등록
AI 연구자 페이페이 리(Fei-Fei Li)의 스타트업 World Labs와 Google DeepMind는 텍스트 프롬프트로부터 완전한 3D 게임 환경을 생성하는 "월드 모델"을 개발하고 있으며, 이 기술을 Unity 및 Epic Games의 Unreal Engine과 같은 기존 게임 엔진을 뒤흔들 수 있는 잠재적 파괴자로 자리매김하고 있습니다. 이러한 움직임은 전 세계 게임 산업이 2025년에 거의 1,970억 달러에 달할 것으로 예상되는 가운데, 게임 개발자들이 근로자들의 우려가 증가함에도 불구하고 AI 도구를 점점 더 많이 채택하고 있는 시점에 나왔습니다.​World Labs는 2025년 11월 첫 번째 상업용 월드 모델 제품인 Marble을 출시했으며, 크리에이터들에게 텍스트 프롬프트, 사진, 동영상 또는 3D 레이아웃을 편집 및 다운로드 가능한 3D 환경으로 전환할 수 있는 기능을 제공합니다. 이 모델은 실시간으로 생성하는 것이 아니라 지속적인 3D 월드를 생성하여, 사용자가 월드를 가우시안 스플랫(Gaussian splats), 메시(meshes) 또는 동영상으로 내보낼 수 있게 합니다. Financial Times에 따르면, 리는 "이 분야는 파괴적 혁신이 무르익었다"고 밝히며 시뮬레이션 게임 엔진이 개선이 필요하다고 언급했습니다.​Google DeepMind는 2025년 8월 Genie 3를 공개하며, 간단한 텍스트 프롬프트로부터 720p 해상도의 대화형 3D 환경을 수 분간 생성할 수 있는 "최초의 실시간 대화형 범용 월드 모델"이라고 설명했습니다. DeepMind의 Genie 3 프로젝트를 공동으로 이끄는 슐로미 프루흐터(Shlomi Fruchter)는 Financial Times에 "소프트웨어, 특히 게임의 제작은 상당한 진화를 겪고 있으며, 향후 몇 년 동안 완전한 변혁을 겪을 것으로 예상합니다"라고 말했습니다. 이 모델은 이전에 생성한 내용을 기억하여 물리적 일관성을 유지하면서 한 번에 한 프레임씩 생성하는 자기회귀 아키텍처를 특징으로 합니다.유럽 노동조합들, AI 추진에 반대이 기술은 노동 단체들의 반대를 촉발했습니다. 프랑스의 STJV, 영국의 IWGB Game Workers, 스페인의 CGT, 이탈리아의 FIOM-CGIL, 독일의 ver.di, 그리고 Game Workers Unite Ireland를 포함한 서유럽 전역의 6개 비디오 게임 노조가 2025년 12월 9일 공동 성명을 발표하며 업계에서 생성형 AI 도구의 사용 증가를 규탄했습니다. 이 연합은 고용 안정성이 약화됨에 따라 "게임 노동자들이 보편적인 도전에 직면하고 있다"고 주장하며, 의무적인 사무실 복귀 정책과 생성형 AI 도구의 강요를 근로 조건을 악화시키는 핵심 문제로 지적했습니다.​Eurogamer에 따르면 IWGB 대변인은 "우리는 게임 노동자들 사이에서 전례 없는 국제적 협력을 목격하고 있습니다"라고 말했습니다. "오랫동안 지속되어 온 고립감과 두려움이 대기업의 지배에 맞서는 통합 전선으로 바뀌고 있습니다". 노조의 성명서는 2022년부터 2025년 중반까지 전 세계 비디오 게임 업계에서 약 45,000개의 일자리가 삭감된 것으로 추정된다고 언급했습니다.​AI에 대한 개발자들의 정서는 점점 더 부정적으로 변하고 있습니다. 2025년 GDC State of the Game Industry 설문조사에 따르면, 응답자의 30%가 생성형 AI가 게임 업계에 부정적인 영향을 미치고 있다고 믿고 있으며, 이는 전년도 대비 12% 증가한 수치입니다. 개발자들은 지적 재산권 도용, 에너지 소비, 그리고 AI 생성 콘텐츠로 인한 품질 저하를 주요 우려 사항으로 꼽았습니다.업계, 비용 절감에 주목지지자들은 월드 모델이 주요 "트리플-A" 게임이 완성되는 데 수년과 10억 달러 이상이 소요될 수 있는 업계에서 개발 비용을 줄이고 근로자의 번아웃을 완화할 수 있다고 주장합니다. 유비소프트에서 어소시에이트 프로듀서로 일했던 DeepMind의 Alexandre Moufarek는 첨부된 기사에 따르면 월드 모델이 개발자들에게 "재미를 발견하고" "새로운 콘셉트를 실험하고 다시 한번 위험을 감수할" 자유를 제공하기를 희망합니다.​World Labs의 공동 창립자인 Justin Johnson은 TechCrunch와의 인터뷰에서 Marble의 초기 사용 사례로 게임, 영화용 시각 효과, 가상 현실을 언급했습니다. Epic Games와 Disney는 5월에 Google과 ElevenLabs의 기술을 활용하여 Fortnite에 AI로 강화된 다스 베이더 캐릭터를 선보였습니다.
899 조회
0 추천
2025.12.27 등록
이번 주 Journal of Economic Behavior & Organization에 게재된 연구에 따르면, 인공지능 시스템은 전략적 의사결정 시나리오에서 인간의 논리적 사고를 지속적으로 과대평가하는 것으로 나타났다. HSE University의 과학자들은 ChatGPT-4o와 Claude-Sonnet-4를 포함한 인기 있는 AI 모델들이 사람들을 실제보다 더 합리적이라고 가정하여, 모델들이 "너무 똑똑하게 플레이"하다가 경쟁 게임에서 지게 된다는 것을 발견했다.​이 연구는 참가자들이 0에서 100 사이의 숫자를 선택하고, 그룹 평균의 절반에 가장 가까운 사람이 승자가 되는 고전적인 경제학 실험인 "숫자 맞추기 게임"에서 5개의 주요 AI 모델이 어떻게 수행되는지를 조사했다. HSE University의 Dmitry Dagaev, Sofia Paklina, Petr Parshakov와 University of Lausanne의 Iuliia Alekseenko 연구원들은 경제학과 1학년 학생부터 게임 이론 학회 참가자에 이르기까지 다양한 가상 상대를 대상으로 16가지 시나리오에서 모델들을 테스트했다.AI는 규칙대로 플레이하지만, 인간은 그렇지 않다모델들은 인간 플레이어가 선택할 것보다 지속적으로 더 낮은 숫자를 선택했으며, 이는 게임 이론 균형과 일치하는 보다 "합리적인" 접근 방식을 반영합니다. 고전적인 실험에서 인간들이 평균 27 정도를 선택했을 때, AI 모델은 상대방도 전략적으로 사고할 것이라고 가정하며 훨씬 더 낮은 숫자를 선택했습니다. The Brighter Side of News에 따르면, 이러한 패턴은 다양한 상대방 설명에서도 일관되게 나타났습니다—게임 이론 전문가를 상대할 때 AI는 0에 가까운 숫자를 선택한 반면, 대학생들을 상대로는 더 높은 숫자를 선택했습니다.​이러한 격차는 AI가 인간 행동을 이해하는 방식의 근본적인 한계를 드러냅니다. 모델들이 상대방의 특성에 따라 선택을 조정하고 전략적 사고를 보여주었지만, 게임의 2인 버전에서 지배적 전략을 식별하는 데는 실패했습니다. Dagaev는 The Brighter Side of News에 "이러한 결과는 AI가 사람들과 마찬가지로 게임 구조의 변화에 반응한다는 것을 보여줍니다"라고 말했지만, 모델들이 "다른 사람들이 무엇을 할지에 대한 단계별 추론에 의존했다"고 덧붙였습니다.AI 배포에 대한 시사점연구 결과는 AI 시스템이 비즈니스 운영 및 의사결정 프로세스에서 점점 더 인간을 대체하고 있다는 점에서 중요한 의미를 지닙니다. Dagaev는 "우리는 이제 AI 모델이 많은 운영 작업에서 인간을 대체하기 시작하여 비즈니스 프로세스의 경제적 효율성을 높이는 단계에 있습니다"라고 말했습니다. "그러나 의사결정 작업에서는 LLM이 인간과 유사한 방식으로 행동하도록 보장하는 것이 종종 중요합니다."​1930년대 영국 경제학자 존 메이너드 케인스(John Maynard Keynes)가 고안한 케인즈의 미인 대회는 참가자들이 단순히 자신의 최적 선택을 하는 것이 아니라 다른 사람들의 선택을 얼마나 잘 예측하는지를 테스트합니다. 이 게임은 성공이 다른 투자자들이 어떻게 행동할지 예측하는 데 달려 있는 금융 시장의 변동을 설명하는 데 오랫동안 사용되어 왔습니다.​HSE 대학교의 기초 연구 프로그램의 지원을 받은 이 연구는 AI가 인간 행동과 일치하는 부분과 차이가 나는 부분을 이해하는 것이 이러한 시스템이 시장, 정책 및 일상 생활에 배치되는 방식을 형성할 것임을 시사합니다.
799 조회
0 추천
2025.12.26 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입