Loading...

AI 뉴스

기술 기업들, 휴머노이드를 위한 인간 동작 데이터 수집 경쟁

페이지 정보

작성자 xtalfi
작성일 2025.11.02 23:14
1,852 조회
0 추천
0 비추천

본문

c622ee1304a9e86449717f38ef081225_1762092643_5282.png
(퍼플렉시티가 정리한 기사)


인도 남부의 작은 산업 도시에서 나빈 쿠마르는 이마에 고프로 카메라를 장착한 채 수백 번 정밀하게 수건을 접는 일을 하며 하루를 보낸다. 책상 오른쪽에서 수건을 집어 들고, 펴서 바르게 한 다음, 세 번 접어서 왼쪽 구석에 놓는 그의 세심한 작업은 호스피탈리티 교육을 위한 것이 아니다. 이것은 테크 거대 기업들이 AI 기반 휴머노이드 로봇에게 인간처럼 행동하는 방법을 가르치는 데 필요한 물리적 움직임 데이터를 생성하는 것이다.

인간의 움직임을 포착하려는 이러한 전 세계적 노력은 인공지능의 차세대 영역을 대표하며, 기업들이 디지털 AI 숙련도에서 물리적 세계 역량으로 전환하기 위해 서두르고 있다. 테슬라, 보스턴 다이내믹스, 엔비디아를 포함한 주요 테크 기업들은 인간 행동의 방대한 데이터셋을 수집하기 위한 노력을 빠르게 확대하고 있으며, 휴머노이드 로봇 시장은 향후 10년간 380억 달러 규모에 이를 것으로 예상된다.


디지털에서 물리적 AI로

Kumar는 2,000명 이상을 고용하고 있으며 그 중 절반이 로보틱스 및 자율주행 차량 센서 데이터에 집중하고 있는 카루르의 데이터 라벨링 회사 Objectways에서 일하고 있습니다. 그의 팀은 최근 미국 고객에게 200개의 수건 접기 영상을 보냈으며, 영상 섹션 주위에 박스를 그리고 팔이 왼쪽 또는 오른쪽으로 움직였는지를 라벨링하면서 각 동작을 세심하게 주석 처리했습니다.

Objectways와 계약을 맺고 있는 샌프란시스코의 데이터 관리 플랫폼 Encord의 공동 창업자인 Ulrik Stig Hansen은 “기업들이 물리적 세계에 적합한 파운데이션 모델을 구축하고 있습니다”라고 말했습니다. “로보틱스 분야에서 엄청난 부흥이 일어나고 있습니다.”

Tesla는 Optimus 휴머노이드 로봇에 대한 야심찬 생산 목표를 가지고 선두를 달리고 있습니다. 회사는 내부 공장 사용을 위해 2025년에 약 5,000대의 로봇을 생산하는 것을 목표로 하고 있으며, 2026년까지 50,000대 규모로 확대할 계획입니다. CEO Elon Musk는 Optimus를 “역대 최대의 제품”이라고 불렀으며, Tesla는 2026년 초에 Optimus 버전 3의 공개를 목표로 하고 있습니다.


대규모 데이터 수집 노력

인간 움직임 데이터 수집 규모가 전례 없는 수준에 도달했습니다. Figure AI는 2025년 9월 부동산 대기업 Brookfield와 파트너십을 맺고 100,000개 가정 내부의 영상을 촬영했으며, 이는 회사가 “세계에서 가장 크고 다양한 실제 휴머노이드 사전 훈련 데이터셋”이라고 부르는 것을 대표합니다. Brookfield의 5억 평방피트 규모의 상업 공간과 1억 6천만 평방피트 규모의 물류 시설에 걸친 인간 비디오 캡처를 활용하여, Figure는 로봇이 인간 중심 환경을 탐색하도록 가르칠 것입니다.

Scale AI는 샌프란시스코 프로토타입 실험실을 통해 별도로 100,000시간의 훈련 영상을 수집했습니다. 최근 Meta 투자 이후 290억 달러로 평가받는 이 회사는 특히 물리적 AI 애플리케이션을 위해 데이터 엔진을 확장하고 있습니다.

한편, Tesla는 헤드셋과 백팩을 착용한 데이터 수집 팀을 고용하여 테이블 닦기, 차량 부품 정리, 심지어 아기 두뇌 발달 장난감 작업—크기와 색상별로 링 끼우기—과 같은 단순한 작업을 수행하는 자신의 모습을 기록합니다. 작업자들은 일부 작업을 “아기를 가르치는 것”이라고 묘사했으며, 이는 캡처되는 움직임의 기본적인 성격을 강조합니다.


기술적 및 상업적 과제

방대한 데이터 수집에 대한 투자에도 불구하고, 여전히 상당한 과제가 남아 있습니다. 요구되는 정밀도는 값싼 노동력을 투입해도 이러한 작업을 종종 수익성이 없게 만듭니다. 벵갈루루 출신의 20세 데브 만달은 클라이언트가 테이블 색상과 조명 조건까지 정확한 사양을 요구한다는 사실을 알게 된 후 자신의 물리적 AI 데이터 수집 사업을 포기했습니다.

보스턴 다이내믹스와 토요타 리서치 인스티튜트는 최근 아틀라스 휴머노이드 로봇에 대규모 행동 모델(Large Behavior Models)을 적용해 걸음, 웅크림, 들어올리기를 연속 동작으로 결합한 자율적 전신 조작을 시연하며 돌파구를 보였습니다. 그러나 많은 현재의 휴머노이드 시연은 여전히 원격 조정에 크게 의존하고 있어 “실질보다는 보여주기”라는 비판을 받고 있습니다.

업계는 디지털 AI 학습과 비교할 때 “데이터 격차”가 상당하다는 점을 인정하고 있습니다. 언어 모델은 인간이 10만 년 동안 읽어야 할 분량의 텍스트로 학습하는 반면, 물리적 AI는 실제 조작 작업을 위한 이와 비교할 만한 데이터셋이 부족합니다.

1X 같은 기업은 최근 식기세척기 비우기, 식물에 물 주기와 같은 가사 일을 할 수 있는 소비자용 휴머노이드 로봇을 $20,000에 발표했지만, 여전히 복잡한 작업에는 인간의 지원이 필요합니다. 이 회사의 한 직원은 자신들이 훈련시키고 있는 로봇에 대해 이렇게 말합니다. “5년, 10년 후면 이 로봇들이 모든 일을 다 하게 되고, 우리에겐 할 일이 남지 않을 거예요”.

댓글 0
전체 1,366 / 49 페이지
Runway는 월요일에 Gen 4.5를 공개했으며, 이는 독립 벤치마킹 업체 Artificial Analysis가 관리하는 Video Arena 리더보드에서 1위를 차지한 새로운 AI 비디오 생성 모델로, 2위인 Google의 Veo 3 모델과 7위인 OpenAI의 Sora 2 Pro를 능가했다.PitchBook에 따르면 35억 5천만 달러의 가치를 평가받은 이 100명 규모의 스타트업은 블라인드 테스트를 사용하며, 투표자들이 어느 회사가 제작했는지 모르는 상태에서 비디오 결과물을 비교하여 순수한 사용자 선호도를 기반으로 편향되지 않은 순위를 보장한다.CEO Cristóbal Valenzuela는 CNBC에 Runway가 “100명의 팀으로 수조 달러 규모의 기업들을 능가하는 데 성공했다”고 말했으며, “David”라는 코드명의 이 모델은 주말까지 회사의 플랫폼, API 및 파트너 통합을 통해 모든 고객에게 제공될 예정이다.
940 조회
0 추천
2025.12.02 등록
Google은 12월 8일 오전 10시(태평양 표준시)에 30분간 라이브스트림을 개최하여 확장 현실 플랫폼인 Android XR의 업데이트를 공개할 예정이며, Gemini AI 통합이 적용된 헤드셋 및 스마트 안경의 새로운 기능에 중점을 둘 것입니다.이 행사는 10월에 출시된 Samsung의 Galaxy XR 헤드셋 출시에 이어 진행되는 것으로, 이는 1,799달러 가격의 첫 번째 Android XR 기기로서 4K 디스플레이와 손동작, 시선 추적, 음성 명령을 통한 AI 기반 상호작용을 특징으로 합니다.티저 자료에 따르면 Google은 2026년 출시 예정인 Samsung의 차기 스마트 안경을 선보일 가능성이 있으며, 이는 Apple의 부진한 Vision Pro 및 Meta의 보다 성공적인 Ray-Ban 스마트 안경과 경쟁하기 위한 것입니다.
935 조회
0 추천
2025.12.02 등록
• 한국 정부는 엔비디아로부터 약 1만3천 개의 GPU를 공급받아 국내 반입을 완료했으며, 이는 지난 5월 추경예산에서 확보한 1조4600억 원으로 집행됐다고 과학기술정보통신부가 1일 밝혔다.• 도입된 GPU에는 최신 B200 모델과 이전 세대 제품이 포함되어 있으며, 정부는 내년 초부터 대학·연구소·스타트업 등에 우선 배정하고 공공 분야에도 투입할 계획이다.• 이는 젠슨 황 CEO가 지난 10월 방한 시 약속한 총 26만여 장 규모(정부 5만 개, 삼성·SK·현대차 각 최대 5만 개, 네이버클라우드 6만 개)의 GPU 공급 계획 중 첫 물량이다.
971 조회
0 추천
2025.12.02 등록
Persistent Systems의 Dattaraj Rao는 VentureBeat에서 온톨로지(기업 맞춤형 개념, 계층 구조, 관계의 정의)가 AI 에이전트가 엔터프라이즈 데이터와 프로세스를 오해하지 않도록 필수적인 가드레일 역할을 한다고 주장합니다. 수십억 달러가 에이전트 인프라에 투자되었음에도 불구하고 실제 성공 사례는 제한적이라는 점을 지적합니다.기사에서는 엔터프라이즈 데이터의 단편화로 인해 중요한 모호성이 발생하는데, 예를 들어 “고객”이라는 단어가 Sales CRM에서는 한 종류의 사람을, 재무 시스템에서는 또 다른 종류의 사람을 의미할 수 있기 때문에, Neo4j와 같은 그래프 데이터베이스를 활용한 온톨로지 기반 접근 방식이 에이전트가 내장된 비즈니스 규칙을 따르면서 질의할 수 있는 통합된 진실의 원천을 마련해야 한다고 설명합니다.이러한 온톨로지 기반 아키텍처는 시급한 엔터프라이즈 과제를 해결합니다. AI의 환각(hallucination) 현상은 기업에게 큰 컴플라이언스와 의사결정 리스크를 야기할 수 있으며, 기술에 대한 관심이 빠르게 증가하고 있음에도 불구하고 실제로 에이전트 기반 AI 워크플로우를 성공적으로 확장한 기업은 11%에 불과하다고 밝혔습니다.
939 조회
0 추천
2025.12.01 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입