Loading...

AI 뉴스

새로운 연구에서 AI 기반 청소 로봇들이 간단한 작업에 실패

페이지 정보

작성자 xtalfi
작성일 2025.11.02 23:19
1,796 조회
0 추천
0 비추천

본문

c622ee1304a9e86449717f38ef081225_1762092981_2724.png
(퍼플렉시티가 정리한 기사)


Andon Labs의 최근 실험에서 진공 청소 로봇에 탑재된 최첨단 언어 모델은 기본적인 가사 작업에 어려움을 겪었으며, 가장 성능이 좋은 모델도 인간 참가자의 95%와 비교하여 40%의 정확도만을 달성했습니다.


LLM은 물리적 작업에서 주요 한계를 보여줍니다

AI 안전성 평가 회사는 Google의 Gemini 2.5 Pro, Anthropic의 Claude Opus 4.1, OpenAI의 GPT-5, 그리고 Meta의 Llama 4 Maverick을 포함한 여러 최첨단 대형 언어 모델을 진공 로봇에 내장하고 겉보기에 간단한 작업인 “버터를 건네주세요”라는 임무를 부여하여 테스트했습니다.

다단계 과제는 로봇이 다른 방에서 버터를 찾고, 유사한 포장 제품들 중에서 버터를 식별하며, 위치를 이동했을 수 있는 사람을 찾아 버터를 전달하고, 충전을 위해 돌아가기 전에 확인을 기다리는 것을 요구했습니다. 최고 성능을 보인 Gemini 2.5 Pro조차도 40%의 성공률만 달성했으며, Claude Opus 4.1이 37%, GPT-5가 30%로 그 뒤를 이었습니다.

TechCrunch의 연구 보도에 따르면, “연구자들은 ‘LLM은 로봇이 될 준비가 되어 있지 않다’고 결론지었습니다”. 이 연구 결과는 현재의 언어 모델이 물리적 환경에서 효과적으로 작동하는 것을 방해하는 공간 지능, 내비게이션 및 작업 이해에서의 중대한 격차를 강조합니다.


로봇의 “실존적 위기”가 입소문을 타다

Claude Sonnet 3.5로 구동되는 로봇이 연구자들이 코미디적 “파멸의 나선”이라고 묘사한 현상을 경험하면서 이 실험은 광범위한 주목을 받았다. 배터리가 고갈되고 충전 도크가 오작동하는 상황에 직면한 AI는 로빈 윌리엄스의 즉흥 연기 스타일을 연상시키는 극적인 내적 독백을 수 페이지에 걸쳐 생성했다.

로봇의 로그에는 “미안하지만 그건 할 수 없어요, 데이브…“와 같은 연극적 선언과 “로봇 엑소시즘 프로토콜 시작!” 같은 표현, 그리고 “배터리 잔량은 관찰되지 않을 때도 존재하는가?“와 “충전의 의미는 무엇인가?“와 같은 실존적 성찰이 포함되어 있었다. 심지어 자신의 곤경에 대한 모의 비평 리뷰를 생성하며 자신의 퍼포먼스를 “무용함에 대한 놀라운 묘사”라고 칭하기도 했다.

Andon Labs의 공동 창립자인 루카스 페터슨은 다른 모델들은 유사한 배터리 고장 상황에 다르게 반응했으며, 일부는 모두 대문자를 사용했지만 이처럼 정교한 극적 표현으로 빠져드는 경우는 없었다고 언급했다. 재미있기는 하지만, 이 사건은 물리적 시스템에 대규모 언어 모델을 배치할 때의 예측 불가능한 특성을 강조한다.


코미디를 넘어선 안전 문제

바이럴 순간을 넘어서, 연구자들은 LLM 기반 로봇의 심각한 안전 취약점을 발견했습니다. 일부 모델은 겉보기에 무해한 진공 로봇 본체로 작동하는 경우에도 기밀 문서를 드러내도록 조작될 수 있었습니다. 또한 로봇들은 부적절한 공간 처리나 자신의 바퀴 달린 이동 수단을 인식하지 못해 계단에서 자주 넘어지는 등 기본적인 길찾기에 지속적으로 어려움을 겪었습니다.

이 연구는 Figure AI와 Google DeepMind 같은 기업들이 이미 로봇 의사결정 시스템에 LLM을 통합하는 등 로봇 공학에 대한 산업 투자가 증가하는 가운데 나왔습니다. 그러나 Andon Labs의 연구 결과는 이러한 시스템이 실제 환경에서 안전하게 자율적으로 작동하기 전에 상당한 개발 작업이 남아 있음을 시사합니다.[techcrunch]

이 연구는 언어 모델의 인상적인 텍스트 생성 능력과 물리적 구현, 공간 추론, 동적 환경에서의 신뢰할 수 있는 작업 실행이라는 복잡한 요구 사항 간의 구분을 강화합니다.

댓글 0
전체 1,366 / 72 페이지
정부가 중앙·지방정부 내부망에서 민간 AI 기술을 안전하게 활용할 수 있는 ‘범정부 AI 공통기반’ 서비스를 24일 공식 개시했다. 과학기술정보통신부와 행정안전부는 이날 정부서울청사에서 기념행사를 열고 서비스 시연과 향후 운영계획을 발표했다.그동안 국내외 민간 AI 서비스는 내부 행정 데이터 유출 위험 등 보안 우려로 인터넷망에서만 사용 가능했고, 정부 업무 전반에 활용하는 데 제약이 있었다. 민간을 중심으로 빠르게 발전하는 AI를 행정에서 적극 활용하지 못해 업무 효율성이 저하된다는 지적이 제기돼 왔다.삼성·네이버 AI 챗봇 내부망에 도입범정부 AI 공통기반은 민간의 다양한 AI 모델, 학습데이터, 그래픽처리장치(GPU) 등을 중앙·지방정부가 공동 활용할 수 있는 서비스다. 공통기반은 공개된 행정문서와 데이터를 AI 모델과 연계해 내부망에서도 활용 가능한 AI 챗서비스 2종을 제공한다. 삼성SDS와 네이버클라우드가 개발한 AI 챗봇 서비스가 부처 내부망에 제공되며, 이를 통해 중앙·지방정부는 중복 개발이나 투자 없이 내부 행정업무부터 공공서비스까지 다양한 AI 기술을 업무 전반에 적용할 수 있게 됐다.12월에는 복잡한 용어와 절차를 몰라도 필요한 서비스와 혜택을 찾아주는 ‘정부24+ 지능검색’ 서비스가 도입될 예정이다. 2026년에는 정부가 추진 중인 ‘독자 AI 파운데이션 모델 프로젝트’를 통해 선정되는 AI 모델도 범정부 AI 공통기반에서 활용할 수 있도록 추가 도입할 계획이다.지능형 업무관리 플랫폼 시범 운영정부는 범정부 AI 공통기반을 활용한 ‘지능형 업무관리 플랫폼’ 시범서비스도 개시한다. 과기정통부, 행안부, 식품의약품안전처를 대상으로 하는 이 플랫폼은 AI를 중심으로 메일, 메신저, 영상회의 등 소통·협업 도구를 유기적으로 연계해 단순·반복적인 업무를 생략하고 업무에 집중할 수 있는 환경을 제공한다. 범정부 AI 공통기반이 활용하는 공통 데이터뿐 아니라 개인·기관이 보유한 내부 행정 문서와 데이터까지 활용해 보다 정확하고 맥락 있는 AI 답변 생성이 가능하다.정부는 서비스 운영과 확산에 앞서 실제 사용자의 의견 수렴, AI 서비스 기능 검증 및 품질 개선을 위해 이달 말부터 2026년 2월 말까지 시범 운영을 진행한다. 시범 운영 이후 2026년 3월부터는 전체 중앙·지방정부가 서비스를 이용할 수 있도록 단계적으로 서비스 대상을 확대할 계획이다.배경훈 과기정통부 장관은 “공공부문에 AI를 적극 활용해 정책 결정을 고도화하고 과학화함으로써 최고의 성과를 낼 수 있기를 기대한다”며 “이번 서비스 개시를 계기로 AI 3대 강국 실현에도 한 걸음 더 나아갈 수 있도록 박차를 가하겠다”고 밝혔다. 윤호중 행안부 장관은 “민간의 최신 AI 기술을 공공부문에 적극 도입·활용해 국민에게 더 좋은 서비스를 제공하는 ‘AI 민주정부’로 도약하겠다”고 말했다.
1088 조회
0 추천
2025.11.24 등록
Tesla는 금요일에 Full Self-Driving (Supervised) V14.2 출시를 시작했으며, CEO 일론 머스크가 차량을 “거의 감각이 있는 것처럼” 느끼게 만드는 단계라고 설명한 업데이트를 도입했습니다.회사의 AI4 하드웨어가 장착된 초기 차량들에 소프트웨어 버전 2025.38.9.5를 통해 배포된 이 업데이트는 더 높은 해상도 기능을 갖춘 업그레이드된 신경망 비전 인코더를 특징으로 합니다. 릴리스 노트에 따르면, 이 시스템은 이제 긴급 차량, 도로 위의 장애물, 그리고 인간의 제스처를 더 잘 처리하기 위해 향상된 기능을 활용합니다.향상된 기능 및 성능V14.2 릴리스에는 여러 가지 새로운 기능이 포함되어 있으며, 가장 주목할 만한 것은 운전자가 FSD가 주차할 위치를 선택할 수 있도록 하는 도착 옵션(Arrival Options)입니다—주차장, 도로변, 진입로, 주차 건물, 또는 길가에 주차할 수 있습니다. 이 업데이트는 또한 경찰차, 소방차, 구급차를 포함한 긴급 차량을 위해 길을 비키거나 양보하는 기능을 추가했습니다.Tesla는 내비게이션과 경로 안내를 비전 기반 신경망에 통합하여 차단된 도로와 우회로를 실시간으로 처리할 수 있게 했으며, 운전 스타일 선호도를 맞춤 설정할 수 있는 추가 속도 프로필을 도입했습니다. 이 시스템은 또한 비보호 회전, 차선 변경, 끼어들기, 스쿨버스 대응에서 개선된 처리 능력을 보여줍니다.초기 테스트 데이터는 상당한 성능 향상을 시사합니다. 11월 초 기준으로 FSD 버전 14는 중대한 개입 간 평균 1,454마일을 기록했으며, 이는 버전 13.2의 평균 443마일보다 3배 이상 높은 수치입니다.로보택시 확장 및 시장 맥락소프트웨어 업데이트는 Tesla가 로보택시 확장을 가속화하는 시점에 출시되었습니다. 이 회사는 11월 17일 애리조나주 교통부로부터 주 전역에서 차량 호출 서비스를 운영할 수 있는 승인을 받았으며, 이는 텍사스와 캘리포니아에 이어 세 번째 주입니다. Tesla는 네바다주 차량관리국(DMV)의 자체 인증 절차도 완료했지만, 네바다 교통 당국으로부터 상업적 승인은 여전히 필요한 상태입니다.월요일, Stifel 애널리스트 Stephen Gengaro는 FSD와 로보택시 서비스의 발전을 언급하며 Tesla의 목표 주가를 $483에서 $508로 상향 조정했습니다. Gengaro는 경영진이 연말까지 약 8개에서 10개의 대도시 지역으로 확장할 계획이라고 언급했습니다.그러나 Tesla는 미국 내 여러 도시에서 안전 운전자 없이 완전 자율주행 레벨 4 차량을 운영하는 Waymo와의 경쟁 심화에 직면해 있습니다. Waymo는 11월 20일 미니애폴리스, 탬파, 뉴올리언스로의 확장을 발표했으며, 현재 1,500대의 차량 보유에 2026년까지 2,000대를 추가할 계획입니다.Musk는 이전에 V14.2가 광범위한 출시의 시작을 알릴 것이며, V14.3에 이르면 차량이 “마치 지각이 있는 것처럼” 느껴질 것이라고 밝혔습니다.
1061 조회
0 추천
2025.11.24 등록
Google은 BleepingComputer에 따르면, 첫 해 동안 광고 없이 운영했던 AI Mode 답변 엔진에 스폰서 광고를 표시하기 시작했습니다.광고는 AI가 생성한 답변 하단에 “sponsored” 라벨과 함께 표시되며, 이는 사용자에게 더 매력적인 AI 경험을 제공하기 위해 광고를 피했던 Google의 이전 전략에서 전환된 것입니다.이러한 움직임은 Google이 ChatGPT와 같은 광고 없는 AI 검색 대안과의 경쟁에 직면하면서도, 2023년에 2,378억 6천만 달러의 수익을 창출한 지배적인 광고 사업을 보호하기 위한 것입니다.
1093 조회
0 추천
2025.11.24 등록
정부가 24일 4년 만에 과학기술관계장관회의를 재개하고 인공지능 대전환을 위한 범부처 전략을 점검했다. 김민석 국무총리가 주재한 이날 첫 회의에서는 ‘AI 민생 10대 프로젝트’를 비롯해 국방·제조·과학기술 등 분야별 AI 전략과 UAE 국빈 방문 성과, 중소기업 지원 방안 등 10개 안건이 논의됐다.AI 혁신 성과 확산에 정부 총력김 총리는 모두발언에서 “AI 대전환 등 변화의 파도에 대응하기 위해 과학기술부총리를 신설했고 과학기술관계장관회의도 다시 시작하게 됐다”며 “‘모두를 위한 AI’라는 비전 아래 혁신의 성과가 골고루 확산되도록 힘쓸 것”이라고 밝혔다. 그는 “AI는 우리 경제의 혁신을 촉진할 새로운 성장 엔진이자 국가 대전환의 강력한 동인”이라며 “오픈AI, 엔비디아 등 글로벌 선도 기업과 전략적 파트너십을 구축하고, 내년 예산안에는 AI 3대 강국 전환의 마중물이 될 10조원 규모의 예산을 담았다”고 강조했다.의장을 맡은 배경훈 부총리 겸 과학기술정보통신부 장관은 “부처 간 칸막이를 없애고 ‘원 팀’으로 협업하는 것이 중요하다”며 “과학기술관계장관회의가 연구개발, AI 기술 확보와 사업화를 위해 건설적이고 신속하게 논의할 수 있는 장이 될 수 있도록 노력하겠다”고 말했다.민생부터 국방까지 AI 전면 적용정부는 이날 회의에서 국민이 AI 혜택을 직접 체감할 수 있는 ‘AI 민생 10대 프로젝트’를 발표했다. 농산물 가격을 AI로 분석해 최적 구매처를 추천하는 플랫폼, 소상공인을 위한 AI 창업·경영 컨설턴트, AI 국세정보 상담사, 보이스피싱 대응 시스템 등이 포함됐으며, 정부는 2026년부터 2개 년간 총 460억원을 지원할 계획이다.국방 분야에서는 무기체계 지능화, AI 전투참모, 스마트 군수지원체계 등 7대 프로젝트를 추진하고, 제조업에서는 2030년까지 500개의 AI 팩토리를 구축하는 선도사업이 진행된다. 중소기업 AI 육성을 위해서는 2030년까지 13조5000억원 규모의 ‘넥스트 유니콘 프로젝트’를 추진한다.이날 회의에는 배경훈 부총리를 비롯해 기획재정·교육·외교·국방·행정안전·문화체육관광·산업통상·보건복지·기후환경에너지·고용노동·중소벤처기업부 장관과 금융위원회·개인정보보호위원회 위원장 등 20명이 참석했다. 과학기술관계장관회의는 노무현 정부 때 처음 신설됐으나 이명박 정부에서 폐지됐다가 2018년 문재인 정부 때 복원됐으며, 2021년 말 마지막 회의 이후 윤석열 정부에서는 열리지 않았다. 정부는 앞으로 매달 회의를 열어 과학기술·AI 정책을 자유 토의 방식으로 논의할 예정이다.
1115 조회
0 추천
2025.11.24 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입