Loading...

AI 뉴스

기술 기업들, 휴머노이드를 위한 인간 동작 데이터 수집 경쟁

페이지 정보

작성자 xtalfi
작성일 2025.11.02 23:14
2,052 조회
0 추천
0 비추천

본문

c622ee1304a9e86449717f38ef081225_1762092643_5282.png
(퍼플렉시티가 정리한 기사)


인도 남부의 작은 산업 도시에서 나빈 쿠마르는 이마에 고프로 카메라를 장착한 채 수백 번 정밀하게 수건을 접는 일을 하며 하루를 보낸다. 책상 오른쪽에서 수건을 집어 들고, 펴서 바르게 한 다음, 세 번 접어서 왼쪽 구석에 놓는 그의 세심한 작업은 호스피탈리티 교육을 위한 것이 아니다. 이것은 테크 거대 기업들이 AI 기반 휴머노이드 로봇에게 인간처럼 행동하는 방법을 가르치는 데 필요한 물리적 움직임 데이터를 생성하는 것이다.

인간의 움직임을 포착하려는 이러한 전 세계적 노력은 인공지능의 차세대 영역을 대표하며, 기업들이 디지털 AI 숙련도에서 물리적 세계 역량으로 전환하기 위해 서두르고 있다. 테슬라, 보스턴 다이내믹스, 엔비디아를 포함한 주요 테크 기업들은 인간 행동의 방대한 데이터셋을 수집하기 위한 노력을 빠르게 확대하고 있으며, 휴머노이드 로봇 시장은 향후 10년간 380억 달러 규모에 이를 것으로 예상된다.


디지털에서 물리적 AI로

Kumar는 2,000명 이상을 고용하고 있으며 그 중 절반이 로보틱스 및 자율주행 차량 센서 데이터에 집중하고 있는 카루르의 데이터 라벨링 회사 Objectways에서 일하고 있습니다. 그의 팀은 최근 미국 고객에게 200개의 수건 접기 영상을 보냈으며, 영상 섹션 주위에 박스를 그리고 팔이 왼쪽 또는 오른쪽으로 움직였는지를 라벨링하면서 각 동작을 세심하게 주석 처리했습니다.

Objectways와 계약을 맺고 있는 샌프란시스코의 데이터 관리 플랫폼 Encord의 공동 창업자인 Ulrik Stig Hansen은 “기업들이 물리적 세계에 적합한 파운데이션 모델을 구축하고 있습니다”라고 말했습니다. “로보틱스 분야에서 엄청난 부흥이 일어나고 있습니다.”

Tesla는 Optimus 휴머노이드 로봇에 대한 야심찬 생산 목표를 가지고 선두를 달리고 있습니다. 회사는 내부 공장 사용을 위해 2025년에 약 5,000대의 로봇을 생산하는 것을 목표로 하고 있으며, 2026년까지 50,000대 규모로 확대할 계획입니다. CEO Elon Musk는 Optimus를 “역대 최대의 제품”이라고 불렀으며, Tesla는 2026년 초에 Optimus 버전 3의 공개를 목표로 하고 있습니다.


대규모 데이터 수집 노력

인간 움직임 데이터 수집 규모가 전례 없는 수준에 도달했습니다. Figure AI는 2025년 9월 부동산 대기업 Brookfield와 파트너십을 맺고 100,000개 가정 내부의 영상을 촬영했으며, 이는 회사가 “세계에서 가장 크고 다양한 실제 휴머노이드 사전 훈련 데이터셋”이라고 부르는 것을 대표합니다. Brookfield의 5억 평방피트 규모의 상업 공간과 1억 6천만 평방피트 규모의 물류 시설에 걸친 인간 비디오 캡처를 활용하여, Figure는 로봇이 인간 중심 환경을 탐색하도록 가르칠 것입니다.

Scale AI는 샌프란시스코 프로토타입 실험실을 통해 별도로 100,000시간의 훈련 영상을 수집했습니다. 최근 Meta 투자 이후 290억 달러로 평가받는 이 회사는 특히 물리적 AI 애플리케이션을 위해 데이터 엔진을 확장하고 있습니다.

한편, Tesla는 헤드셋과 백팩을 착용한 데이터 수집 팀을 고용하여 테이블 닦기, 차량 부품 정리, 심지어 아기 두뇌 발달 장난감 작업—크기와 색상별로 링 끼우기—과 같은 단순한 작업을 수행하는 자신의 모습을 기록합니다. 작업자들은 일부 작업을 “아기를 가르치는 것”이라고 묘사했으며, 이는 캡처되는 움직임의 기본적인 성격을 강조합니다.


기술적 및 상업적 과제

방대한 데이터 수집에 대한 투자에도 불구하고, 여전히 상당한 과제가 남아 있습니다. 요구되는 정밀도는 값싼 노동력을 투입해도 이러한 작업을 종종 수익성이 없게 만듭니다. 벵갈루루 출신의 20세 데브 만달은 클라이언트가 테이블 색상과 조명 조건까지 정확한 사양을 요구한다는 사실을 알게 된 후 자신의 물리적 AI 데이터 수집 사업을 포기했습니다.

보스턴 다이내믹스와 토요타 리서치 인스티튜트는 최근 아틀라스 휴머노이드 로봇에 대규모 행동 모델(Large Behavior Models)을 적용해 걸음, 웅크림, 들어올리기를 연속 동작으로 결합한 자율적 전신 조작을 시연하며 돌파구를 보였습니다. 그러나 많은 현재의 휴머노이드 시연은 여전히 원격 조정에 크게 의존하고 있어 “실질보다는 보여주기”라는 비판을 받고 있습니다.

업계는 디지털 AI 학습과 비교할 때 “데이터 격차”가 상당하다는 점을 인정하고 있습니다. 언어 모델은 인간이 10만 년 동안 읽어야 할 분량의 텍스트로 학습하는 반면, 물리적 AI는 실제 조작 작업을 위한 이와 비교할 만한 데이터셋이 부족합니다.

1X 같은 기업은 최근 식기세척기 비우기, 식물에 물 주기와 같은 가사 일을 할 수 있는 소비자용 휴머노이드 로봇을 $20,000에 발표했지만, 여전히 복잡한 작업에는 인간의 지원이 필요합니다. 이 회사의 한 직원은 자신들이 훈련시키고 있는 로봇에 대해 이렇게 말합니다. “5년, 10년 후면 이 로봇들이 모든 일을 다 하게 되고, 우리에겐 할 일이 남지 않을 거예요”.

댓글 0
전체 1,366 / 33 페이지
• 라쿠텐 그룹인 [RKUNY +1.40%]는 일본어에 최적화된 7,000억 파라미터 대규모 언어 모델 Rakuten AI 3.0를 12월 18일 공개했다. 이 모델은 일본어 벤치마크에서 GPT-4o를 능가했으며, 유사 규모의 서드파티 AI 모델 대비 최대 90%의 비용 절감을 제공한다.[global.rakuten +1]• 이 모델은 일본 정부가 지원하는 GENIAC 프로젝트의 일환으로 개발되었으며, 일본 경제산업성 및 신에너지·산업기술종합개발기구(NEDO)가 주도하고, 이 이니셔티브를 통해 일부 학습 비용을 지원받았다.[global.rakuten +1]• 라쿠텐은 2026년 봄에 이 모델을 오픈 웨이트로 공개할 계획이며, Rakuten AI Gateway 플랫폼을 통해 전자상거래, 핀테크, 여행, 엔터테인먼트 서비스 등 자사 전체 에코시스템에 이를 통합하고 있다.[global.rakuten +1]
892 조회
0 추천
2025.12.21 등록
• 한국 정부는 19일 제22차 국가핵융합위원회에서 핵융합에너지 전력생산 실증 목표를 2050년대에서 2030년대로 20년 앞당기는 로드맵을 의결했다[mk +2].• 정부는 2030년까지 노심 플라즈마 제어, 초전도 자석 등 8대 핵심기술을 개발하고 2035년까지 실증을 완료하며, 전남 나주에 1조5000억원 규모의 한국형 혁신 핵융합로를 건설할 계획이다[mk +2].• AI 데이터센터의 전력 소비가 2030년까지 2배 이상 증가할 것으로 예상되면서[g-enews], 트럼프 미디어가 핵융합 기업 TAE테크놀로지스와 합병하는 등 글로벌 핵융합 개발 경쟁이 가속화되고 있다[mk +2].
909 조회
0 추천
2025.12.21 등록
구글이 빠른 속도와 낮은 비용을 갖춘 경량 인공지능(AI) 모델 '제미나이3 플래시'를 17일(현지시간) 공개했다. 이번 출시로 구글은 최상위 모델인 '딥싱크', 균형 모델인 '프로'와 함께 제미나이3 제품군의 삼각 편대를 완성했다.상위 모델 능가하는 성능, 4분의 1 가격제미나이3 플래시는 일부 벤치마크에서 상위 모델인 제미나이3 프로를 능가하는 성과를 보였다. 일반 지식을 측정하는 'MMLU-Pro'에서 81.2%, 코딩 능력을 재는 'SWE-벤치 베리파이드'에서 78%를 기록해 프로 모델의 각각 81%와 76.2%를 웃돌았다.​과학 지식 평가인 'GPQA 다이아몬드'와 인류의 마지막 시험으로 불리는 'HLE' 벤치마크에서도 각각 90.4%와 33.7%를 기록해 프로 모델(91.9%, 37.5%)과 큰 차이가 없는 수준을 보였다.​속도와 지능의 균형제미나이3 플래시는 제미나이 2.5 프로보다 3배 빠른 속도를 자랑하며, 일상적 작업에서 평균 30% 적은 토큰을 사용한다. API 요금은 토큰당 0.5∼3달러로 프로 모델(2∼12달러)의 4분의 1 수준이다.​조시 우드워드 구글랩스·제미나이 담당 부사장은 "오랫동안 AI는 비싸고 느린 대형 모델과 성능이 떨어지는 고속 모델 사이 선택을 강요했다"며 "제미나이3 플래시는 이와 같은 타협을 끝내고 지능과 속도를 모두 제공한다"고 밝혔다.​제미나이3 플래시는 무료 이용자를 포함해 전 세계에서 사용할 수 있으며, 구글은 제미나이 앱과 AI 모드에서 이를 기본 모델로 적용했다.경량 모델은 방대한 데이터로 학습한 상위 모델을 기반으로 '증류'라는 작업을 거쳐 만들어진다. 속도가 빠르면서도 상위 모델에 버금가는 성능을 내는 것이 특징이다.
918 조회
0 추천
2025.12.20 등록
• OpenAI, ChatGPT의 '따뜻함'과 '열정' 수준을 사용자가 조절할 수 있는 기능 출시• 이모지, 헤더, 목록 사용 빈도도 개인화 설정 가능• 채팅 내에서 직접 이메일 텍스트 수정 및 포맷팅 기능 추가OpenAI가 ChatGPT의 친절함 수준을 사용자가 직접 조절할 수 있는 새로운 기능을 선보였다. 금요일부터 순차 배포되는 이번 업데이트를 통해 사용자는 ChatGPT의 '따뜻함'과 '열정'이라는 성격 특성을 '더 많이' 또는 '더 적게' 원하는 대로 설정하거나 기본값을 유지할 수 있게 됐다.이 외에도 ChatGPT가 이모지, 헤더, 목록을 얼마나 자주 사용할지 조정하는 옵션도 제공된다. 이러한 설정은 ChatGPT 앱 좌측 상단 메뉴를 탭한 후 프로필을 선택하고 '개인화' 항목에서 '특성 추가'를 선택하면 확인할 수 있다. 여기서 사용자는 AI 챗봇의 '성격'도 선택할 수 있는데, 독특함, 전문적임, 친근함, 냉소적임 등 다양한 옵션이 마련되어 있다.또 다른 업데이트는 ChatGPT로 이메일을 작성하는 방식을 개선한다. 이제 채팅 내에서 직접 텍스트를 수정하고 포맷을 변경할 수 있다. 특정 텍스트 부분을 하이라이트하여 ChatGPT에게 해당 부분만 수정하도록 요청할 수도 있어, 별도의 프롬프트에서 해당 섹션을 일일이 지정할 필요가 없어졌다.
844 조회
0 추천
2025.12.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입