Loading...

AI 뉴스

기술 기업들, 휴머노이드를 위한 인간 동작 데이터 수집 경쟁

페이지 정보

작성자 xtalfi
작성일 2025.11.02 23:14
1,783 조회
0 추천
0 비추천

본문

c622ee1304a9e86449717f38ef081225_1762092643_5282.png
(퍼플렉시티가 정리한 기사)


인도 남부의 작은 산업 도시에서 나빈 쿠마르는 이마에 고프로 카메라를 장착한 채 수백 번 정밀하게 수건을 접는 일을 하며 하루를 보낸다. 책상 오른쪽에서 수건을 집어 들고, 펴서 바르게 한 다음, 세 번 접어서 왼쪽 구석에 놓는 그의 세심한 작업은 호스피탈리티 교육을 위한 것이 아니다. 이것은 테크 거대 기업들이 AI 기반 휴머노이드 로봇에게 인간처럼 행동하는 방법을 가르치는 데 필요한 물리적 움직임 데이터를 생성하는 것이다.

인간의 움직임을 포착하려는 이러한 전 세계적 노력은 인공지능의 차세대 영역을 대표하며, 기업들이 디지털 AI 숙련도에서 물리적 세계 역량으로 전환하기 위해 서두르고 있다. 테슬라, 보스턴 다이내믹스, 엔비디아를 포함한 주요 테크 기업들은 인간 행동의 방대한 데이터셋을 수집하기 위한 노력을 빠르게 확대하고 있으며, 휴머노이드 로봇 시장은 향후 10년간 380억 달러 규모에 이를 것으로 예상된다.


디지털에서 물리적 AI로

Kumar는 2,000명 이상을 고용하고 있으며 그 중 절반이 로보틱스 및 자율주행 차량 센서 데이터에 집중하고 있는 카루르의 데이터 라벨링 회사 Objectways에서 일하고 있습니다. 그의 팀은 최근 미국 고객에게 200개의 수건 접기 영상을 보냈으며, 영상 섹션 주위에 박스를 그리고 팔이 왼쪽 또는 오른쪽으로 움직였는지를 라벨링하면서 각 동작을 세심하게 주석 처리했습니다.

Objectways와 계약을 맺고 있는 샌프란시스코의 데이터 관리 플랫폼 Encord의 공동 창업자인 Ulrik Stig Hansen은 “기업들이 물리적 세계에 적합한 파운데이션 모델을 구축하고 있습니다”라고 말했습니다. “로보틱스 분야에서 엄청난 부흥이 일어나고 있습니다.”

Tesla는 Optimus 휴머노이드 로봇에 대한 야심찬 생산 목표를 가지고 선두를 달리고 있습니다. 회사는 내부 공장 사용을 위해 2025년에 약 5,000대의 로봇을 생산하는 것을 목표로 하고 있으며, 2026년까지 50,000대 규모로 확대할 계획입니다. CEO Elon Musk는 Optimus를 “역대 최대의 제품”이라고 불렀으며, Tesla는 2026년 초에 Optimus 버전 3의 공개를 목표로 하고 있습니다.


대규모 데이터 수집 노력

인간 움직임 데이터 수집 규모가 전례 없는 수준에 도달했습니다. Figure AI는 2025년 9월 부동산 대기업 Brookfield와 파트너십을 맺고 100,000개 가정 내부의 영상을 촬영했으며, 이는 회사가 “세계에서 가장 크고 다양한 실제 휴머노이드 사전 훈련 데이터셋”이라고 부르는 것을 대표합니다. Brookfield의 5억 평방피트 규모의 상업 공간과 1억 6천만 평방피트 규모의 물류 시설에 걸친 인간 비디오 캡처를 활용하여, Figure는 로봇이 인간 중심 환경을 탐색하도록 가르칠 것입니다.

Scale AI는 샌프란시스코 프로토타입 실험실을 통해 별도로 100,000시간의 훈련 영상을 수집했습니다. 최근 Meta 투자 이후 290억 달러로 평가받는 이 회사는 특히 물리적 AI 애플리케이션을 위해 데이터 엔진을 확장하고 있습니다.

한편, Tesla는 헤드셋과 백팩을 착용한 데이터 수집 팀을 고용하여 테이블 닦기, 차량 부품 정리, 심지어 아기 두뇌 발달 장난감 작업—크기와 색상별로 링 끼우기—과 같은 단순한 작업을 수행하는 자신의 모습을 기록합니다. 작업자들은 일부 작업을 “아기를 가르치는 것”이라고 묘사했으며, 이는 캡처되는 움직임의 기본적인 성격을 강조합니다.


기술적 및 상업적 과제

방대한 데이터 수집에 대한 투자에도 불구하고, 여전히 상당한 과제가 남아 있습니다. 요구되는 정밀도는 값싼 노동력을 투입해도 이러한 작업을 종종 수익성이 없게 만듭니다. 벵갈루루 출신의 20세 데브 만달은 클라이언트가 테이블 색상과 조명 조건까지 정확한 사양을 요구한다는 사실을 알게 된 후 자신의 물리적 AI 데이터 수집 사업을 포기했습니다.

보스턴 다이내믹스와 토요타 리서치 인스티튜트는 최근 아틀라스 휴머노이드 로봇에 대규모 행동 모델(Large Behavior Models)을 적용해 걸음, 웅크림, 들어올리기를 연속 동작으로 결합한 자율적 전신 조작을 시연하며 돌파구를 보였습니다. 그러나 많은 현재의 휴머노이드 시연은 여전히 원격 조정에 크게 의존하고 있어 “실질보다는 보여주기”라는 비판을 받고 있습니다.

업계는 디지털 AI 학습과 비교할 때 “데이터 격차”가 상당하다는 점을 인정하고 있습니다. 언어 모델은 인간이 10만 년 동안 읽어야 할 분량의 텍스트로 학습하는 반면, 물리적 AI는 실제 조작 작업을 위한 이와 비교할 만한 데이터셋이 부족합니다.

1X 같은 기업은 최근 식기세척기 비우기, 식물에 물 주기와 같은 가사 일을 할 수 있는 소비자용 휴머노이드 로봇을 $20,000에 발표했지만, 여전히 복잡한 작업에는 인간의 지원이 필요합니다. 이 회사의 한 직원은 자신들이 훈련시키고 있는 로봇에 대해 이렇게 말합니다. “5년, 10년 후면 이 로봇들이 모든 일을 다 하게 되고, 우리에겐 할 일이 남지 않을 거예요”.

댓글 0
전체 1,366 / 74 페이지
Benedict Evans의 90슬라이드 프레젠테이션 분석에 따르면, AI의 입증된 효과에도 불구하고 일상적인 AI 도입은 조용한 위기를 나타내며, 조직들은 AI가 산업 구조와 경쟁 역학을 변화시키는 것에 대체로 준비가 되어 있지 않다고 주장합니다.이 기사는 Evans의 프레젠테이션에서 AI가 “기적에서 인프라로” 전환하는 것을 포함한 다섯 가지 핵심 주제를 식별하며, 초기 AI 배포에서의 경로 의존성이 조직이 제한된 사용 사례에 갇히게 될지 아니면 전략적 이점을 달성할지를 결정한다고 주장합니다.현재 78%의 기업이 최소 한 가지 비즈니스 기능에서 AI를 사용하고 있지만, 상당한 영향을 창출하는 “AI 고성과자”로 분류되는 기업은 6%에 불과하며, 미국 성인 5명 중 약 1명이 매일 AI를 사용하고 있어 도입과 의미 있는 구현 사이의 상당한 격차를 강조합니다.
1098 조회
0 추천
2025.11.24 등록
Interconnects는 오픈 AI 모델을 공개하는 약 20개의 미국 연구소를 확인했으며—중국과 비슷한 수준—하지만 미국의 노력은 더 작은 모델 크기와 더 제한적인 라이선스로 인해 방해받고 있어, 결과적으로 글로벌 영향력이 감소하고 있다고 주장합니다.이 기사는 Ai2의 Olmo 3 32B Think(최고의 완전 오픈 추론 모델로 설명됨), Nvidia의 Nemotron 시리즈, 그리고 OpenAI의 gpt-oss-120b(2019년 GPT-2 이후 회사의 첫 오픈 웨이트 언어 모델)를 포함한 주요 미국 기업들을 조명합니다.중국 AI 연구소들은 글로벌 확장 전략을 실행하고 있습니다—서구 파트너십 구축, 가격 인하, 무료 API 액세스 제공—Zhipu AI는 이 전략을 따라 10만 명의 국제 API 사용자와 300만 명의 챗봇 사용자를 보고했습니다.
1035 조회
0 추천
2025.11.24 등록
남아프리카공화국 요하네스버그에서 23일(현지시간) 폐막한 주요 20개국(G20) 정상회의에서 이재명 대통령이 인공지능 기술의 혜택을 모든 국가가 공유하는 ‘글로벌 AI 기본사회’ 구축을 강조했다. 이번 회의를 통해 한국은 2028년 G20 의장국 지위를 공식 확정했다.이 대통령은 23일 ‘모두를 위한 공정한 미래’를 주제로 열린 제3세션에서 “모든 인류가 인공지능의 혜택을 고루 향유하는 글로벌 AI 기본사회 실현을 위해 국제사회와 적극 협력해 나갈 것”이라고 밝혔다. 이는 지난 11월 1일 경주에서 열린 아시아태평양경제협력체(APEC) 정상회의에서 채택한 ‘APEC AI 이니셔티브’의 핵심 화두를 아시아·태평양 지역을 넘어 G20 무대로 확장한 것이다.핵심광물 협력과 다자무역 강조이 대통령은 이날 회의에서 안정적이고 호혜적인 핵심광물 공급망 구축의 필요성도 역설했다. 그는 “핵심 광물의 보유국과 수요국이 혜택을 공유할 수 있도록 안정적이고 호혜적인 광물 공급망을 구축해야 한다”며 “올해 G20 정상회의에서 이런 취지의 ‘G20 핵심광물 프레임워크’ 논의가 이뤄진 점을 의미 있게 생각한다”고 말했다. 한국은 현재 핵심광물안보파트너십(MSP) 의장국을 맡고 있다.22일 첫 세션에서 이 대통령은 “성장 잠재력 제고를 위해 예측 가능한 무역 투자 환경을 조성해야 한다”며 세계무역기구(WTO) 기능 회복의 필요성을 강조했다. 그는 “WTO의 기능 회복은 우리 모두의 이익에 부합한다”며 “대한민국이 선도해 온 ‘투자원활화 협정’이 내년 WTO 각료회의에서 공식 협정으로 채택될 수 있도록 노력하겠다”고 밝혔다.2028년 G20 의장국 확정G20 정상들은 22일 채택한 ‘G20 남아공 정상선언문’을 통해 “2026년 미국, 2027년 영국 의장국 하에서 협력하고, 2028년 대한민국에서 다시 만나기로 약속한다”고 발표했다. 한국이 G20 정상회의를 개최하는 것은 2010년 서울 회의 이후 18년 만이다.이 대통령은 23일 “대한민국은 위기의 순간마다 국제사회의 나침반이 되어준 G20을 함께 설계한 나라로서 G20 정상회의 출범 20년인 2028년 다시 의장직을 맡아 여정을 함께 이어가려 한다”며 “막중한 책임감으로 G20이 국제 경제 협력을 위한 최상위 포럼으로 위상을 더욱 공고히 할 수 있도록 역할을 다하겠다”고 말했다.[daum +1]이번 정상회의는 미국·중국·러시아 3국 정상이 모두 불참하는 이례적인 상황 속에서 열렸다. 도널드 트럼프 미국 대통령은 남아공의 백인 정책 문제를 이유로 회의 불참을 선언했으나, 정상들은 개막 첫날 다자주의 정신을 강조하는 정상선언문을 채택했다.
1054 조회
0 추천
2025.11.24 등록
Ant Group의 LingGuang은 자연어 프롬프트를 통해 맞춤형 소프트웨어를 생성하는 “바이브 코딩” 애플리케이션으로, 11월 18일 출시 후 4일 만에 100만 다운로드를 돌파했다고 중국 핀테크 대기업이 토요일 발표했다.프로그래밍 지식 없이 약 30초 만에 기능적인 애플리케이션을 만들 수 있는 이 앱은 11월 22일 기준 Apple의 중국 본토 App Store에서 무료 유틸리티 부문 1위, 전체 무료 앱 중 7위를 기록했다. Ant Group에 따르면 이 이정표는 ChatGPT와 Sora의 초기 채택률을 앞질렀다.서버 부담으로 인한 일시적 중단사용자 수요의 급증으로 LingGuang의 인프라가 과부하되면서, Ant Group은 11월 21일 목요일 저녁 앱의 핵심 생성 기능을 일시적으로 중단했습니다. 회사는 Weibo의 게시물에서 이러한 중단을 “과도한 사용량”으로 인한 것이라고 설명했습니다. Ant Group은 “이 이정표는 LingGuang이 빠르게 진화하는 글로벌 AI 경쟁에서 주목할 만한 핵심 플레이어임을 의미합니다”라고 밝혔습니다.이 애플리케이션은 코드 조각을 생성하는 대신 완전한 애플리케이션을 직접 생성함으로써 경쟁사와 차별화되며, 회사에 따르면 사용자에게 “자신만의 개인 AI 개발자”를 효과적으로 제공합니다. LingGuang의 기술 책임자이자 전 Google 직원인 Cai Wei는 현지 매체와의 인터뷰에서 사용자들이 세션당 평균 6회의 편집 라운드에 참여했으며, 이는 초기 예상을 초과하는 수치라고 말했습니다.바이브 코딩 시장이 뜨겁게 달아오르다LingGuang의 빠른 확산은 사용자가 전통적인 프로그래밍 대신 대화형 프롬프트를 통해 소프트웨어를 만드는 바이브 코딩(vibe coding)의 성장 모멘텀을 반영합니다. 미국 기반 경쟁사 Replit은 2024년 말 1천만 달러에서 2025년 6월 연간 반복 매출 1억 달러를 달성했습니다. 최근 분석에 따르면 바이브 코딩 시장은 2030년까지 1,500억~4,000억 달러에 달할 것으로 전망됩니다.Alibaba 창립자 마윈(Jack Ma)은 LingGuang 출시 당일 Ant Group의 항저우 캠퍼스를 방문하여 회사 경영진의 AI 이니셔티브에 대한 관심 증가를 나타냈습니다. Ant Group은 South China Morning Post를 소유한 Alibaba의 계열사입니다.
1061 조회
0 추천
2025.11.24 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입