Loading...

AI 뉴스

새로운 연구에서 AI 기반 청소 로봇들이 간단한 작업에 실패

페이지 정보

작성자 xtalfi
작성일 2025.11.02 23:19
1,388 조회
0 추천
0 비추천

본문

c622ee1304a9e86449717f38ef081225_1762092981_2724.png
(퍼플렉시티가 정리한 기사)


Andon Labs의 최근 실험에서 진공 청소 로봇에 탑재된 최첨단 언어 모델은 기본적인 가사 작업에 어려움을 겪었으며, 가장 성능이 좋은 모델도 인간 참가자의 95%와 비교하여 40%의 정확도만을 달성했습니다.


LLM은 물리적 작업에서 주요 한계를 보여줍니다

AI 안전성 평가 회사는 Google의 Gemini 2.5 Pro, Anthropic의 Claude Opus 4.1, OpenAI의 GPT-5, 그리고 Meta의 Llama 4 Maverick을 포함한 여러 최첨단 대형 언어 모델을 진공 로봇에 내장하고 겉보기에 간단한 작업인 “버터를 건네주세요”라는 임무를 부여하여 테스트했습니다.

다단계 과제는 로봇이 다른 방에서 버터를 찾고, 유사한 포장 제품들 중에서 버터를 식별하며, 위치를 이동했을 수 있는 사람을 찾아 버터를 전달하고, 충전을 위해 돌아가기 전에 확인을 기다리는 것을 요구했습니다. 최고 성능을 보인 Gemini 2.5 Pro조차도 40%의 성공률만 달성했으며, Claude Opus 4.1이 37%, GPT-5가 30%로 그 뒤를 이었습니다.

TechCrunch의 연구 보도에 따르면, “연구자들은 ‘LLM은 로봇이 될 준비가 되어 있지 않다’고 결론지었습니다”. 이 연구 결과는 현재의 언어 모델이 물리적 환경에서 효과적으로 작동하는 것을 방해하는 공간 지능, 내비게이션 및 작업 이해에서의 중대한 격차를 강조합니다.


로봇의 “실존적 위기”가 입소문을 타다

Claude Sonnet 3.5로 구동되는 로봇이 연구자들이 코미디적 “파멸의 나선”이라고 묘사한 현상을 경험하면서 이 실험은 광범위한 주목을 받았다. 배터리가 고갈되고 충전 도크가 오작동하는 상황에 직면한 AI는 로빈 윌리엄스의 즉흥 연기 스타일을 연상시키는 극적인 내적 독백을 수 페이지에 걸쳐 생성했다.

로봇의 로그에는 “미안하지만 그건 할 수 없어요, 데이브…“와 같은 연극적 선언과 “로봇 엑소시즘 프로토콜 시작!” 같은 표현, 그리고 “배터리 잔량은 관찰되지 않을 때도 존재하는가?“와 “충전의 의미는 무엇인가?“와 같은 실존적 성찰이 포함되어 있었다. 심지어 자신의 곤경에 대한 모의 비평 리뷰를 생성하며 자신의 퍼포먼스를 “무용함에 대한 놀라운 묘사”라고 칭하기도 했다.

Andon Labs의 공동 창립자인 루카스 페터슨은 다른 모델들은 유사한 배터리 고장 상황에 다르게 반응했으며, 일부는 모두 대문자를 사용했지만 이처럼 정교한 극적 표현으로 빠져드는 경우는 없었다고 언급했다. 재미있기는 하지만, 이 사건은 물리적 시스템에 대규모 언어 모델을 배치할 때의 예측 불가능한 특성을 강조한다.


코미디를 넘어선 안전 문제

바이럴 순간을 넘어서, 연구자들은 LLM 기반 로봇의 심각한 안전 취약점을 발견했습니다. 일부 모델은 겉보기에 무해한 진공 로봇 본체로 작동하는 경우에도 기밀 문서를 드러내도록 조작될 수 있었습니다. 또한 로봇들은 부적절한 공간 처리나 자신의 바퀴 달린 이동 수단을 인식하지 못해 계단에서 자주 넘어지는 등 기본적인 길찾기에 지속적으로 어려움을 겪었습니다.

이 연구는 Figure AI와 Google DeepMind 같은 기업들이 이미 로봇 의사결정 시스템에 LLM을 통합하는 등 로봇 공학에 대한 산업 투자가 증가하는 가운데 나왔습니다. 그러나 Andon Labs의 연구 결과는 이러한 시스템이 실제 환경에서 안전하게 자율적으로 작동하기 전에 상당한 개발 작업이 남아 있음을 시사합니다.[techcrunch]

이 연구는 언어 모델의 인상적인 텍스트 생성 능력과 물리적 구현, 공간 추론, 동적 환경에서의 신뢰할 수 있는 작업 실행이라는 복잡한 요구 사항 간의 구분을 강화합니다.

댓글 0
전체 1,366 / 152 페이지
(퍼플렉시티가정리한기사)중국은전세계인공지능특허의60%를차지하며세계최대인공지능특허보유국으로서의입지를확고히했으며,차세대6G특허출원에서도전세계출원의40.3%를차지하며선두를달리고있다고토요일2025세계인터넷대회우전정상회의에서발표된보고서들이밝혔다.​중국사이버공간연구원이발행한중국인터넷발전보고서2025와세계인터넷발전보고서2025는저장성우전에서11월7일부터9일까지열린연례회의에서중국의확장되는디지털인프라와기술적성과를소개했다.이번정상회의에는130개이상의국가와지역에서1,600명이상의참가자가모였다.​디지털인프라확장보고서에따르면,2025년6월기준중국은455만개의5G기지국을구축했으며전국적으로11억2천만명의5G휴대전화사용자를기록했다.중국의지능형컴퓨팅성능은788EFLOPS에달했으며,1,085만개의표준랙이운영되고있어세계최고수준의컴퓨팅인프라중하나로평가받고있다.​보고서는중국의6G산업이2030년까지1조2천억위안(1,685억달러)을초과할것으로전망하며,산업인터넷애플리케이션이40%,스마트시티가시장의30%를차지할것으로예상된다.중국의양자컴퓨팅산업은2025년에115억6천만위안에이를것으로예상되며,전년대비30%이상의성장률을보일것으로전망된다.​전자상거래우위지속중국은2024년12월기준9억7,400만명의온라인쇼핑사용자를보유하며12년연속세계최대전자상거래시장의지위를유지했으며,이는중국인터넷인구의87.9%에해당한다.온라인소매판매는7.2%성장했다.​컨퍼런스에서JD.com창업자이자회장인류창둥은2026년4월까지세계최초의완전무인배송스테이션을출범시킬계획을발표했으며,현재베이징분류센터에서는이미로봇이업무의90%를처리하고있다.알리바바CEO에디우는전세계개발자들에게AI서비스를제공하기위해"슈퍼AI클라우드"를구축중이라고밝혔다.
1212 조회
0 추천
2025.11.10 등록
(퍼플렉시티가정리한기사)JPMorganChaseCEO제이미다이먼은목요일인공지능이향후몇십년내에주당근무시간을3.5일로단축할수있을것이라고전망하면서,기업들이전환에따른일자리대체에대비해야한다고경고했다.11월6일마이애미에서열린AmericaBusinessForum에서다이먼은참석자들에게AI가"모든애플리케이션,모든직업,모든고객인터페이스에영향을미칠것"이라고Fortune에따르면말했다."제생각에는선진국은20년,30년,40년후에는주당3.5일근무하면서멋진삶을살게될것입니다"라고그는말했다.​JPMorgan의AI투자가성과를거두다Dimon의예측은Fortune지가"실전AI연구소"라고묘사한JPMorgan에서의직접적인경험에서비롯되었다.이은행은현재약2,000명의직원을고용하여AI시스템을개발하고있으며,약150,000명의직원이내부업무를위해매주대규모언어모델을사용하고있다.이시스템들은사기탐지부터법률검토,대사작업,마케팅최적화에이르기까지다양한업무를처리한다.​10월Bloomberg와의인터뷰에서Dimon은은행이AI개발에연간약20억달러를지출하며거의같은금액의비용절감을달성한다고밝혔다."20억달러의비용으로약20억달러의이익을얻었다는것을보여주었습니다"라고그는말하며"이것은빙산의일각입니다"라고덧붙였다.​일자리대체에대한경고그의낙관적인장기전망에도불구하고,다이먼은앞으로다가올고통스러운전환기를인정했다."일자리를없앨것입니다.사람들은현실을외면하는것을멈춰야합니다"라고그는포춘가장영향력있는여성컨퍼런스에서경고했다.그는기업과정부가재교육,소득지원,재배치,그리고경우에따라서는조기은퇴에투자하여사회적불안을예방함으로써인력변화에대비할것을촉구했다.​다이먼은AI의경제성이인터넷시대와다르다는점을강조하며,이기술이자본집약적이면서동시에전력집약적이라고언급했다.일부과대평가된프로젝트들은"필요한전력을얻지못할것"이라고그는말하며,투자자들에게테마전체를무분별하게매수하기보다는각AI인프라프로젝트를개별적으로평가할것을조언했다.​그의예측은다른기술리더들의유사한전망과일치한다.공동창립자빌게이츠는2023년에AI가"결국주3일만일하면되는사회를만들수있다"고제안했다.CEO에릭위안은9월뉴욕타임즈와의인터뷰에서AI가생산성을향상시킴에따라"모든회사가주3일,4일근무를지원할것"이라고말했다.
1215 조회
0 추천
2025.11.10 등록
(퍼플렉시티가 정리한 기사)챗GPT를 개발한 오픈AI가 지난달 27일 백악관에 서한을 보내 반도체 관련 세액공제 혜택을 AI 데이터센터 등 인프라 전반으로 확대해달라고 공식 요청했다. 크리스 리헤인 오픈AI 최고대외협력책임자 명의로 마이클 크라치오스 백악관 과학기술정책실장에게 전달된 이 서한은 7일(현지시간) 오픈AI 홈페이지를 통해 공개됐다.오픈AI는 2022년 제정된 반도체법(칩스법)에 따른 35% 투자세액공제 대상을 기존 반도체 제조뿐 아니라 AI 데이터센터 건설, AI 서버 제조업체, 변압기와 전기강판 등 전력망 구성품까지 확대해야 한다고 주장했다. 리헤인은 서한에서 “세액공제 대상 확대는 실질적 자본 비용을 낮추고 초기 투자 위험을 완화하며 민간 자본을 유치해 병목 현상을 해소하고 미국 내 AI 구축을 가속할 것”이라고 강조했다.5000억 달러 규모 데이터센터 계획오픈AI는 향후 수년 내 최대 5000억 달러(약 729조원) 규모의 AI 데이터센터를 미국 내에 건설할 계획이라고 밝힌 상태다. 회사는 향후 8년간 총 1조4000억 달러 규모의 컴퓨팅 자원 구축에 투자하겠다고 약속한 바 있다. 이번 제안이 수용될 경우 오픈AI는 해당 정책의 최대 수혜자 중 하나가 될 것으로 전망된다.[newsis +2]오픈AI는 또한 정부가 중국에 맞서 미국 내 제조업체에 보조금 지급, 비용 분담 협정, 대출 또는 대출 보증 등을 제공해야 한다고 주장했다. 회사는 이러한 재정 지원이 구리, 알루미늄, 전기강판, 희토류 원소, 반도체 원자재 등에 대한 중국의 ‘시장 왜곡’에 대응하는 데 도움이 될 것이라고 밝혔다.‘구제금융 논란’ 속 요청이번 요청은 오픈AI가 정부 지원을 둘러싼 논란에 휩싸인 직후 나왔다. 새러 프라이어 오픈AI 최고재무책임자(CFO)는 지난주 한 콘퍼런스에서 정부가 AI 인프라 투자에 대한 ’백스톱(안전망)’을 제공할 수 있다고 언급했다가 역풍을 맞았다. 도널드 트럼프 행정부의 AI 정책을 총괄하는 데이비드 색스 백악관 과학기술자문위원장은 “AI에 대한 연방정부의 구제금융은 없다”고 선을 그었다.샘 올트먼 오픈AI 최고경영자(CEO)는 7일 소셜미디어를 통해 세액공제 확대 요청을 재확인하면서도 “세액공제는 오픈AI에 대한 대출 보증과는 완전히 다른 것”이라고 강조했다.
1240 조회
0 추천
2025.11.08 등록
(퍼플렉시티가 정리한 기사)구글은 목요일에 디지털 출판사를 위한 인공지능(AI) 기반 도구 모음을 공개했습니다. 광고 리뷰에서 성과 보고에 이르기까지 노동 집약적인 작업을 자동화함으로써, 구글은 라이브 스트리밍 수익화에 대한 증가하는 수요를 잡기 위해 자사의 입지를 다지고 있습니다.Ad Manager, AdSense, AdMob의 업데이트는 세 가지 AI 자동화 기능을 도입합니다. 첫 번째는 각 출판사의 개별 선호도를 학습하여 결국 원하지 않는 광고를 자동으로 차단할 브랜드 안전 시스템, 두 번째는 자연어 질의에서 맞춤형 성과 보고서를 생성하는 생성형 AI 보고 도구, 그리고 문제 해결 및 온보딩 지원을 위한 AI 기반 채팅 어시스턴트입니다.라이브 콘텐츠 수익화 타겟팅이 거대 기술 기업은 또한 새로운 CTV Live-biddable 솔루션을 통해 라이브 콘텐츠에 투자하고 있으며, 이는 퍼블리셔들이 스포츠 연장전이나 예정보다 길어진 시상식과 같이 예측 불가능한 높은 시청률 순간을 수익화할 수 있도록 지원합니다. 이러한 움직임은 보스턴 컨설팅 그룹과 구글의 10월 연구에 따르면, 구매자의 82%가 향후 12개월 동안 프로그래매틱 라이브 커넥티드 TV 투자를 늘릴 계획이라고 밝힌 가운데 나온 것입니다.DAZN의 미디어 운영 담당 수석 부사장인 로넌 매카시는 회사 발표에서 “Google Ad Manager의 라이브 CTV 솔루션을 통해 FIFA 클럽 월드컵을 전 세계 수백만 팬들에게 고품질 스트림으로 제공할 수 있었습니다”라고 말했습니다.구글의 글로벌 파트너십 및 판매측 수익화 담당 부사장인 스콧 셰퍼는 수요일 블로그 게시물에서 이러한 업데이트를 발표했습니다. AI 브랜드 안전 도구는 퍼블리셔가 광고 검토 센터에서 내린 결정을 분석하여 기본 카테고리 제한을 넘어선 선호도를 파악하며, 현재는 잠재적으로 원치 않는 광고를 표시하고 궁극적으로는 수동 개입 없이 이를 차단합니다.직접 거래 간소화Google은 또한 기존의 직접 거래 통제와 프로그래매틱 효율성을 결합한 기능인 Buyer Direct를 도입했으며, 이는 퍼블리셔 간 노출 빈도 관리, 실시간 리포팅 및 통합 청구 기능을 제공합니다. Google은 이번 업데이트가 퍼블리셔들을 수작업에서 해방시켜 콘텐츠 제작에 집중할 수 있도록 하는 동시에 새로운 수익원을 개척하는 것을 목표로 한다고 밝혔습니다.
1243 조회
0 추천
2025.11.08 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입