Loading...

AI 뉴스

Claude AI, 로봇 프로그래밍 시간 절반으로 단축

페이지 정보

작성자 xtalfi
작성일 2025.11.14 16:10
1,412 조회
0 추천
0 비추천

본문

AI-Lab-Claude-Hacks-Robot-Dog-Business.jpg

(퍼플렉시티가 정리한 기사)


AI 안전 회사 Anthropic은 화요일, 자사의 Claude AI 모델이 비전문가 연구원들이 사족 보행 로봇을 프로그래밍하는 데 걸리는 시간을 인간만으로 작업한 경우의 약 절반으로 단축하는 데 도움을 주었다고 밝혔으며, 이는 디지털 세계와 물리적 세계를 연결할 수 있는 AI 시스템을 향한 중요한 진전을 의미한다.​

11월 12일에 발표된 Project Fetch라는 실험에서, Anthropic은 로봇 공학 전문 지식이 없는 자사 연구원 8명을 두 팀으로 나누어 Unitree Go2 로봇 개에게 비치볼을 자율적으로 가져오도록 프로그래밍하는 과제를 부여했다. Claude에 접근할 수 있었던 팀은 AI 지원 없이 작업한 팀보다 약 절반의 시간에 과제를 완료했다.​


디지털과 물리적 세계의 연결

이 연구는 하드웨어 연결과 온보드 센서 접근이라는 복잡한 프로세스를 간소화하는 Claude의 능력을 입증했으며, AI 지원 팀이 가장 두드러진 이점을 보인 영역이었다. Anthropic의 레드팀 소속 Logan Graham은 WIRED에 "우리는 AI 모델의 다음 단계가 세상으로 뻗어나가 더 광범위하게 세상에 영향을 미치기 시작할 것이라고 의심하고 있습니다"라고 말했다. "이를 위해서는 모델이 로봇과 더욱 인터페이스해야 할 것입니다".​

Team Claude는 $16,900짜리 Unitree Go2 로봇을 프로그래밍하여 비치볼을 자율적으로 찾아 탐색하는 데 성공했지만, 하루 동안의 실험 내에서 최종 회수 작업을 완료하지는 못했다. 반면 Team Claude-less는 로봇과의 기본적인 연결조차 구축하는 데 어려움을 겪었으며 자율 볼 회수를 향한 실질적인 진전을 전혀 이루지 못했다.​

실험은 또한 흥미로운 팀 역학을 드러냈다. Claude 없이 작업한 연구원들은 훨씬 더 많은 부정적 감정과 혼란을 표현한 반면, AI 지원 팀은 각 구성원이 자신의 Claude 인스턴스와 협력하며 대체로 병렬적으로 작업했다. 그러나 AI 기반 접근 방식은 때때로 핵심 목표에서 주의를 분산시키는 탐색적 "사이드 퀘스트"로 이어지기도 했다.​


안전 우려 증가

이 연구는 AI 제어 로봇에 대한 우려가 커지는 가운데 나왔다. 이번 주 International Journal of Social Robots에 게재된 연구에 따르면, OpenAI, Google, Meta의 인기 챗봇을 구동하는 AI 모델들이 로봇 시나리오에서 테스트했을 때 심각한 피해를 일으킬 수 있는 명령을 승인한 것으로 나타났다.​

Anthropic은 현재 모델들이 로봇을 완전히 자율적으로 제어할 만한 지능은 부족하지만, 향후 버전은 그러한 능력을 갖출 수 있다고 강조했다. 회사의 연구 결과는 모델이 개선됨에 따라 "이전에 알려지지 않은 하드웨어와 상호작용하여 물리적 세계에 영향을 미치는 능력이 급격히 발전할 수 있다"고 시사한다.

댓글 0
전체 1,366 / 29 페이지
구글이 빠른 속도와 낮은 비용을 갖춘 경량 인공지능(AI) 모델 '제미나이3 플래시'를 17일(현지시간) 공개했다. 이번 출시로 구글은 최상위 모델인 '딥싱크', 균형 모델인 '프로'와 함께 제미나이3 제품군의 삼각 편대를 완성했다.상위 모델 능가하는 성능, 4분의 1 가격제미나이3 플래시는 일부 벤치마크에서 상위 모델인 제미나이3 프로를 능가하는 성과를 보였다. 일반 지식을 측정하는 'MMLU-Pro'에서 81.2%, 코딩 능력을 재는 'SWE-벤치 베리파이드'에서 78%를 기록해 프로 모델의 각각 81%와 76.2%를 웃돌았다.​과학 지식 평가인 'GPQA 다이아몬드'와 인류의 마지막 시험으로 불리는 'HLE' 벤치마크에서도 각각 90.4%와 33.7%를 기록해 프로 모델(91.9%, 37.5%)과 큰 차이가 없는 수준을 보였다.​속도와 지능의 균형제미나이3 플래시는 제미나이 2.5 프로보다 3배 빠른 속도를 자랑하며, 일상적 작업에서 평균 30% 적은 토큰을 사용한다. API 요금은 토큰당 0.5∼3달러로 프로 모델(2∼12달러)의 4분의 1 수준이다.​조시 우드워드 구글랩스·제미나이 담당 부사장은 "오랫동안 AI는 비싸고 느린 대형 모델과 성능이 떨어지는 고속 모델 사이 선택을 강요했다"며 "제미나이3 플래시는 이와 같은 타협을 끝내고 지능과 속도를 모두 제공한다"고 밝혔다.​제미나이3 플래시는 무료 이용자를 포함해 전 세계에서 사용할 수 있으며, 구글은 제미나이 앱과 AI 모드에서 이를 기본 모델로 적용했다.경량 모델은 방대한 데이터로 학습한 상위 모델을 기반으로 '증류'라는 작업을 거쳐 만들어진다. 속도가 빠르면서도 상위 모델에 버금가는 성능을 내는 것이 특징이다.
582 조회
0 추천
2025.12.20 등록
• OpenAI, ChatGPT의 '따뜻함'과 '열정' 수준을 사용자가 조절할 수 있는 기능 출시• 이모지, 헤더, 목록 사용 빈도도 개인화 설정 가능• 채팅 내에서 직접 이메일 텍스트 수정 및 포맷팅 기능 추가OpenAI가 ChatGPT의 친절함 수준을 사용자가 직접 조절할 수 있는 새로운 기능을 선보였다. 금요일부터 순차 배포되는 이번 업데이트를 통해 사용자는 ChatGPT의 '따뜻함'과 '열정'이라는 성격 특성을 '더 많이' 또는 '더 적게' 원하는 대로 설정하거나 기본값을 유지할 수 있게 됐다.이 외에도 ChatGPT가 이모지, 헤더, 목록을 얼마나 자주 사용할지 조정하는 옵션도 제공된다. 이러한 설정은 ChatGPT 앱 좌측 상단 메뉴를 탭한 후 프로필을 선택하고 '개인화' 항목에서 '특성 추가'를 선택하면 확인할 수 있다. 여기서 사용자는 AI 챗봇의 '성격'도 선택할 수 있는데, 독특함, 전문적임, 친근함, 냉소적임 등 다양한 옵션이 마련되어 있다.또 다른 업데이트는 ChatGPT로 이메일을 작성하는 방식을 개선한다. 이제 채팅 내에서 직접 텍스트를 수정하고 포맷을 변경할 수 있다. 특정 텍스트 부분을 하이라이트하여 ChatGPT에게 해당 부분만 수정하도록 요청할 수도 있어, 별도의 프롬프트에서 해당 섹션을 일일이 지정할 필요가 없어졌다.
573 조회
0 추천
2025.12.20 등록
OpenAI는 2025년 12월 17일 뉴스 조직을 위한 아카데미를 출범했으며, 이는 기자와 출판사가 AI 도구를 업무 흐름에 통합할 수 있도록 주문형 교육, 기술 플레이북 및 오픈 소스 프로젝트를 제공하는 무료 글로벌 학습 플랫폼입니다.이 이니셔티브는 뉴욕에서 열린 AI 및 저널리즘 정상회의에서 공개되었으며, Brown Institute for Media Innovation 및 Hearst와 공동 주최했고, American Journalism Project 및 The Lenfest Institute for Journalism과의 파트너십을 기반으로 합니다.이 아카데미는 OpenAI가 The New York Times Company [NYT +0.35%]로부터 저작권 소송을 받고 있는 동시에 News Corp [NWSA -0.95%] 및 Axel Springer를 포함한 주요 출판사들과 라이선스 계약을 추진하고 있는 가운데 출범했습니다
567 조회
0 추천
2025.12.20 등록
개발자 생산량이 76% 급증했습니다. 2025년 AI 코딩 도구가 개발자당 코드 라인 수를 4,450에서 7,839로 늘렸으며, 중간값 풀 리퀘스트 크기가 3월부터 11월까지 33% 증가했다고 2,000개 기업의 월 10억 라인 코드를 처리하는 Greptile 연구가 밝혔습니다.AI 코딩 어시스턴트 채택률이 **소프트웨어 개발 전문가의 90%**에 도달했으며, CodeRabbit의 470개 오픈 소스 풀 리퀘스트 분석 결과 AI 생성 코드가 사람이 작성한 코드보다 1.7배 더 많은 결함을 발생시키고, 논리 오류는 75% 증가했으며 성능 비효율성은 거의 8배 더 자주 나타나는 것으로 나타났습니다.OpenAI 대비 Anthropic SDK 다운로드 비율이 2024년 1월 47:1에서 2025년 11월 4.2:1로 급락하면서 경쟁 구도가 빠르게 변화하고 있으며, 전문가들은 AI의 예측 가능한 품질 약점을 완화하기 위해 더 엄격한 코드 리뷰 프로세스와 자동화된 테스트를 권장하고 있습니다.
575 조회
0 추천
2025.12.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입