Loading...

AI 뉴스

Anthropic, 30시간 연속 코딩 가능한 Claude Sonnet 4.5 공개

페이지 정보

작성자 xtalfi
작성일 2025.09.30 04:32
990 조회
0 추천
0 비추천

본문

a8a1b7e496e0800b10a4e49c82e0f025T9Yu.png

(퍼플렉시티가 정리한 기사)

앤트로픽은 월요일에 Claude Sonnet 4.5를 공개하며, 이 인공지능 모델이 자율 코딩 능력에서 획기적인 발전을 이뤘음을 강조했습니다. Claude Sonnet 4.5는 30시간 이상 연속으로 작업할 수 있는데, 이는 이전 모델보다 네 배 이상 오래 지속되는 것입니다.


샌프란시스코에 본사를 둔 이 AI 기업은 의 지원을 받고 있으며, 기업 가치는 1,830억 달러에 달합니다. 앤트로픽은 이번 신형 모델이 산업 벤치마크 전반의 성능을 바탕으로 “세계 최고의 코딩 모델”이라고 주장합니다. Claude Sonnet 4.5는 실제 프로그래밍 과제로 AI 모델을 평가하는 엄격한 소프트웨어 엔지니어링 시험인 SWE-Bench Verified에서 77.2%의 점수를 획득했습니다.

 

혁신적인 자율 역량


모델의 확장된 운영 능력은 5월 출시 당시 약 7시간 동안만 집중을 유지할 수 있었던 Claude Opus 4에서 획기적인 도약을 보여줍니다. 내부 테스트 동안 Claude Sonnet 4.5는 전체 채팅 애플리케이션을 자율적으로 개발했으며, 개발 과정 전반에 걸쳐 일관성을 유지하면서 약 11,000줄의 코드를 생성했습니다.


“Claude Sonnet 4.5는 우리의 기대를 새롭게 합니다—30시간 이상의 자율 코딩을 소화하며, 엔지니어들이 복잡한 아키텍처 작업을 몇 달씩 들여야 할 일을 대폭 단축된 시간 내에, 방대한 코드베이스 전반에서 일관성을 유지하면서 처리할 수 있도록 돕습니다,“라고 iGent AI의 CEO인 Sean Ward는 밝혔습니다.


이 모델은 또한 컴퓨터 상호작용 작업에서도 우수한 성능을 보여줬으며, OSWorld 벤치마크에서 61.4%의 점수를 획득해, 불과 4개월 전 Claude Sonnet 4가 기록한 42.2%에서 거의 20%포인트 향상된 결과를 보였습니다.

 

향상된 개발자 도구 및 안전 기능


순수한 코딩 성능을 넘어서, Claude Sonnet 4.5는 도구의 향상과 안전성 강화로 개발자 워크플로우에 중요한 개선을 도입했습니다. 이 모델은 이제 Claude Code에서 체크포인트를 지원하여, 개발자가 진행 상황을 저장하고 이전 상태로 되돌릴 수 있게 하였습니다. 이는 코딩 커뮤니티에서 가장 많이 요청된 기능 중 하나를 해결한 것입니다. 또한, 사용자들은 이제 대화 내에서 직접 코드 실행은 물론, 스프레드시트, 슬라이드, 문서 등 다양한 파일을 생성할 수 있습니다.


Anthropic은 이를 “지금까지 가장 정렬된 프런티어 모델”로 자리매김하며, 아첨, 기만, 권력 추구와 같은 문제적인 행동이 대폭 감소한 점을 강조하고 있습니다. 또한, 악의적인 행위자가 특별히 제작한 입력값을 통해 AI 시스템을 조작하려고 하는 프롬프트 인젝션 공격에 대한 방어도 한층 강화했습니다. 이러한 안전성 개선과 더불어 Claude Agent SDK가 출시되어, 개발자들이 Claude Code를 구동하는 것과 동일한 인프라를 활용하여, 메모리 관리, 권한 처리, 다중 서브에이전트 조정이 가능한 독자적인 자율 에이전트를 구축할 수 있게 됐습니다.

댓글 0
전체 1,021 / 185 페이지
(퍼플렉시티가 정리한 기사)로봇 공학의 전설이자 아이로봇(iRobot)의 공동 창립자이며 수십 년간 MIT에서 활동한 로드니 브룩스(Rodney Brooks)가 인류형 로봇 산업의 붐에 대해 가차 없는 현실 검증을 내놓았습니다. 그는 테슬라(Tesla, Inc.)와 Figure 같은 기업에 쏟아지는 수십억 달러가 “순전한 환상에 불과하다”며, 결코 대량생산에 도달하지 못할 것이라고 단언했습니다.브룩스의 신랄한 평가는 인류형 로봇 산업이 전례 없는 성장세를 보이는 가운데 나왔습니다. 최근 Figure가 2025년 9월에 무려 390억 달러의 기업가치로 10억 달러 이상의 자금을 유치한 것이 그 예입니다. 2025년 29억 2000만 달러로 평가된 전 세계 인류형 로봇 시장은 2030년까지 152억 6000만 달러로 폭발적으로 성장할 것으로 전망되고 있습니다. 이 성장은 유수의 기술 기업들이 인간과 유사한 기계를 개발하기 위해 치열한 경쟁을 벌이는 덕분입니다.근본적인 결함브룩스는 테슬라와 피겨가 선호하는 접근 방식을 특히 비판합니다. 이들은 로봇에게 인간이 작업을 수행하는 영상을 보여주어 손재주를 가르치려 합니다. 브룩스는 그의 최근 에세이에서 “이건 완전한 환상에 불과하다”고 주장하며, 투자자들이 무시하는 중요한 한계를 강조합니다.핵심 문제는 인간의 해부학적 구조 자체에 있습니다. 인간의 손에는 스마트폰보다 작은 공간에 약 17,000개의 특수 촉각 수용체가 집중되어 있어, 현재의 어떤 로봇도 이와 비슷한 촉각 정교함에는 전혀 미치지 못하고 있습니다. 브룩스는 “머신러닝이 음성 인식과 이미지 처리에 혁명을 일으켰을 때, 그 돌파구는 적절한 데이터를 포착하는 수십 년의 기존 기술을 기반으로 했다”고 설명합니다. “우리는 촉각 데이터에는 그런 전통이 없다”.브룩스는 또한, 똑바로 서 있기 위해 막대한 에너지가 필요하고 넘어질 경우 위험해지는, 실물 크기의 이족보행 휴머노이드 로봇에 대한 심각한 안전 우려도 제기합니다. 물리학 원리에 따르면, 현재 모델의 두 배 크기인 로봇은 여덟 배의 유해한 에너지를 갖게 됩니다.근본적인 결함브룩스는 테슬라와 피겨가 선호하는 접근 방식을 특히 비판합니다. 이들은 로봇에게 인간이 작업을 수행하는 영상을 보여주어 손재주를 가르치려 합니다. 브룩스는 그의 최근 에세이에서 “이건 완전한 환상에 불과하다”고 주장하며, 투자자들이 무시하는 중요한 한계를 강조합니다.핵심 문제는 인간의 해부학적 구조 자체에 있습니다. 인간의 손에는 스마트폰보다 작은 공간에 약 17,000개의 특수 촉각 수용체가 집중되어 있어, 현재의 어떤 로봇도 이와 비슷한 촉각 정교함에는 전혀 미치지 못하고 있습니다. 브룩스는 “머신러닝이 음성 인식과 이미지 처리에 혁명을 일으켰을 때, 그 돌파구는 적절한 데이터를 포착하는 수십 년의 기존 기술을 기반으로 했다”고 설명합니다. “우리는 촉각 데이터에는 그런 전통이 없다”.브룩스는 또한, 똑바로 서 있기 위해 막대한 에너지가 필요하고 넘어질 경우 위험해지는, 실물 크기의 이족보행 휴머노이드 로봇에 대한 심각한 안전 우려도 제기합니다. 물리학 원리에 따르면, 현재 모델의 두 배 크기인 로봇은 여덟 배의 유해한 에너지를 갖게 됩니다.산업적 시사점Brooks는 인간형 로봇 도입을 둘러싼 일정에 의문을 제기하는 데 있어 혼자가 아닙니다. 로봇에 투자해 2만 달러를 6천만 달러로 불린 저명한 로봇 투자자 크리스 카밀로는, 투자자들이 배치의 어려움을 과소평가하고 있다고 경고합니다. “제조 역량이 인간형 로봇의 핵심 병목이라는 인식은 잘못된 것입니다,“라고 카밀로는 지적하며, 월마트와 페덱스 같은 기업에서의 통합 문제는 인간형 로봇이 현실 세계 운영에 통합되기 전에 수년간의 전략적 작업이 필요할 것이라고 설명했습니다.특히 Brooks의 업적을 고려하면 이러한 비판은 더욱 무게를 갖습니다. 그가 MIT에서 1980년대 행동 기반 로봇공학 분야에서 이룩한 선구적인 연구는 현대 자율시스템, 즉 화성 탐사선에서부터 전 세계 수백만 대의 룸바가 집안을 누비는 데 이르는 알고리즘에 직접적인 영향을 미쳤습니다. 한 업계 관찰자는 “그가 불가능하다고 말하는 걸 투자자들은 주목해야 한다”고 언급했습니다.
936 조회
0 추천
2025.09.28 등록
(퍼플렉시티가 정리한 기사)메타는 빠르게 진화하는 로봇 산업에서 다음 주요 경쟁자로 자신을 포지셔닝하며, 다른 기업들이 자사의 휴머노이드 로봇에 적용할 수 있도록 포괄적인 소프트웨어 플랫폼을 개발할 계획을 발표했습니다. 최근 인터뷰에서 최고기술책임자(CTO) 앤드류 보스워스가 밝힌 이 전략은 구글의 스마트폰용 안드로이드 모델의 성공을 본뜬 것이며, 증강현실(AR)에 이은 메타의 최신 수십억 달러 규모의 도전입니다.“하드웨어가 힘든 부분이라고 생각하지 않습니다.“라고 보스워스는 이번 주 더 버지(The Verge)와의 인터뷰에서 밝혔습니다. 그는 이 프로젝트를 “AR 규모의 베팅”이라고 부르며 수십억 달러의 투자가 필요하다고 시사했습니다. “하드웨어 역시 어렵지 않다는 의미는 아니지만, 병목은 아닙니다. 진짜 병목은 소프트웨어입니다.”메타의 안드로이드식 접근 방식이 구체화된다회사의 로보틱스 부문은 Reality Labs 하드웨어 유닛 내에 설립되었으며, 전 Cruise CEO인 Marc Whitten이 이끌고 있습니다. 이 부문은 자체 휴머노이드 프로토타입인 “Metabot”과 다른 제조업체들이 도입할 수 있는 근본적인 소프트웨어 플랫폼을 개발하고 있습니다. 경쟁사인 테슬라와 애플와 달리, 메타의 주된 초점은 로봇을 직접 개발·판매하는 것이 아니라, 이를 구동하는 인텔리전스를 만드는 데에 있습니다.“우리가 하드웨어 제조사가 되는 것엔 관심이 없습니다,”라고 Bosworth는 설명하며, 미래에는 어떤 로봇 기업이든 “로봇이 이 사양을 만족하기만 하면” 메타의 소프트웨어를 사용할 수 있게 될 것이라고 내다봤습니다. 이런 플랫폼 우선 전략은, 전 Scale CEO 알렉산드르 왕(Alexandr Wang)이 이끄는 신설 Superintelligence Labs를 통해 인공지능 분야에서 메타가 이루고 있는 혁신에 기반하고 있습니다.Bosworth가 ‘월드 모델’이라 부르는 이 접근법은, 섬세한 조작 등 복잡한 물리작용을 시뮬레이션할 수 있는 AI 시스템 개발에 주안점을 두고 있습니다. 그가 자신의 인터뷰에서 물컵을 들어올리며 설명했듯, 로봇은 평지에서 달리거나 백플립을 할 수 있지만, 섬세한 물체를 잡으려 하면 “컵을 으깨버리거나 곧바로 물을 다 쏟아버리죠”라고 도전 과제를 예시로 들었습니다.경쟁 환경이 더욱 치열해지고 있다메타는 테슬라가 정기적으로 옵티머스(Optimus) 로봇을 선보이고 있는 혼잡한 분야에 진입하고 있다. 다만, 테슬라의 시연은 대부분 매우 통제된 환경에서 이뤄졌다. 애플 역시 2027년 출시를 목표로 탁상용 로봇 기기와 인간형(휴머노이드) 컨셉을 모두 개발 중인 것으로 알려졌다. 구글 또한 딥마인드를 통해 로보틱스 분야에서 투자를 강화하면서 최근 로봇 응용을 위해 특별히 설계된 새로운 AI 모델을 소개했다.메타가 최근 서커스(SE)와의 협력을 통해 독일에서 첫 자율 로봇을 배치한 시점도 전략적으로 보인다. 이 협력으로 CA-1 AI 로봇이 9월 메타 뮌헨 오피스에 납품되었다. 이와 같은 실제 적용 사례는 처음에는 청소, 세탁물 정리 등 가사 업무에 집중된 메타의 광범위한 로보틱스 계획에 중요한 데이터를 제공한다.업계 분석가들은 소프트웨어 라이선스 모델이 하드웨어 비용과 제조 공정의 난관을 자주 겪는 로봇 시장에서 메타의 성공을 이끄는 결정적 요인이 될 수 있다고 분석한다. 어떤 로봇 하드웨어 제조사가 성공하더라도 그 혜택을 볼 수 있게 입지를 다져둔 셈이며, 이는 소비자 채택이 제한된 상황에서 수십억 달러를 하드웨어에 쏟아부은 고가의 가상현실 투자 경험에서 메타가 얻은 교훈을 적용한 것으로 보인다.회사는 2025년까지 AI 인프라에 600~650억 달러를 투입하는 대규모 투자 계획의 하나로, 로보틱스 프로젝트를 위해 약 100명 규모의 엔지니어 채용을 허가했다. 이는 AI 지능을 물리적 세계에 실현하겠다는 장기 비전에 대한 메타의 진지한 의지를 보여준다.
984 조회
0 추천
2025.09.28 등록
(퍼플렉시티가 정리한 기사)유튜브가 오늘 새로운 실험 플랫폼인 유튜브 랩스를 출시하며, 동영상 스트리밍 대기업에서 앞으로 진행될 인공지능 실험 시리즈의 첫 기능으로 AI 음악 호스트를 선보였습니다. 이번 프로그램은 유튜브가 스포티파이의 인기 있는 AI DJ 기능과 직접 경쟁하려는 최신 노력의 일환이며, 첨단 AI 도구를 테스트할 수 있는 장을 마련하는 것이기도 합니다.첫 번째 실험인 “Beyond the Beat”는 AI 호스트가 라디오 믹스와 플레이리스트를 진행하는 동안 노래에 관한 해설, 팬 트리비아, 그리고 콘텍스트 있는 이야기를 제공할 수 있게 해줍니다. 이 기능은 좋아요/싫어요 버튼과 댓글 버튼 사이에 반짝이 아이콘으로 표시되어, 사용자가 AI가 생성한 해설을 듣고 싶을 때 직접 제어할 수 있도록 합니다.AI DJ 분야에서 경쟁하기유튜브의 이번 조치는 스포티파이가 AI DJ 기능을 도입한 지 2년이 넘은 뒤에 이루어진 것으로, 회사에 따르면 이 기능의 참여도는 지난 1년 동안 거의 두 배로 증가했다. 이번 시점은 스트리밍 플랫폼들이 AI 기반 개인화 기능을 통해 경쟁이 치열해지는 가운데 전략적 선택으로 보인다.“이 AI 진행자들은 라디오와 믹스를 청취하는 동안 관련 이야기와 인사이트를 들려줄 것입니다,“라고 유튜브는 오늘 블로그 게시글에서 발표했다. 사용자는 코멘터리를 1시간 또는 하루 동안 잠시 꺼둘 수 있어, 음악 감상 중 원치 않는 방해에 대한 잠재적 우려를 해소한다.플랫폼은 “AI 코멘터리는 실수를 포함할 수 있다”고 경고하며, 기술의 실험적 성격을 인정하는 동시에 사용자 피드백이 미래 개발 방향에 도움이 될 것이라고 강조했다.제한된 접근과 프리미엄 중심YouTube Labs는 현재 “미국 내 참가자 중 제한된 수”만을 수용하고 있으며, 프리미엄 가입자가 실험적 기능을 널리 출시하기 전에 우선적으로 테스트할 수 있는 권한을 받습니다. 이 프로그램은 Google Labs와 별도로 운영되며, Google의 광범위한 AI 이니셔티브가 아닌 YouTube 플랫폼에만 초점을 맞추고 있습니다.이 독점적 접근 모델은 YouTube가 최근 프리미엄 구독을 새로운 기능의 테스트 장으로 활용하는 전략을 따릅니다. 올해 초, 회사는 음악 트랙용 고음질 오디오, 최대 4배까지 빠른 재생 속도, 스마트 TV 및 게임 콘솔용 Jump Ahead 기능 등 여러 가지 프리미엄 전용 기능을 출시했습니다.레딧 이용자 보고에 따르면, 초기 테스터들은 이미 AI 호스트를 경험하고 있으며, 한 참가자는 해당 기능이 트랙에 대한 “통찰력 있는 요약”을 제공하지만 가끔 “말 대신 이상한 잡음”을 발생시키기도 한다고 언급했습니다. 이 해설은 각 트랙이 아닌 약 다섯 곡마다 나타나며, 정보 제공과 끊김 없는 청취 사이에서 균형을 이루고 있습니다.
944 조회
0 추천
2025.09.28 등록
(퍼플렉시티가 정리한 기사)여덟 개의 주요 오픈소스 재단이 이번 주에 “무료” 소프트웨어 인프라의 시대가 끝나가고 있다고 선언했으며, 인공지능 주도의 수요가 중요 패키지 레지스트리를 지속 불가능한 한계로 밀어붙이고 있다고 경고했다.오픈소스 시큐리티 재단이 주도하고 파이썬 소프트웨어 재단, 러스트 재단, 이클립스 재단 등이 참여한 이 연합은 화요일에 오픈소스 인프라의 자금 조달 및 소비 방식에 근본적인 변화가 필요하다는 공동 성명을 발표했다. 이들이 감독하는 레지스트리에는 파이썬을 위한 PyPI, 자바를 위한 Maven Central, 자바스크립트를 위한 npm 등이 포함되어 있으며, 이들은 매달 수십억 건의 다운로드를 제공하지만, 대부분 기부와 자원봉사자들의 선의에 의존해 운영되고 있다.AI 사용이 ‘불필요한’ 수요를 창출하다재단들은 생성형 AI와 자율 코딩 에이전트로 인한 “기계 주도적이고 종종 낭비적인 자동화 사용 폭발”을 시스템에 대한 주요 부담으로 지적했다. 지속적인 통합 파이프라인, 대규모 종속성 스캐너, 그리고 AI 도구들이 패키지 레지스트리로 캐싱이나 제한 메커니즘 없이 자동화된 요청을 폭발적으로 보내고 있다.“상업 규모의 사용에 비해 상업 규모의 지원이 없다면 지속 가능성이 없습니다,“라고 연합은 밝혔다. 현재의 자금 조달 모델은 소수의 후원자들에게 의존하고 있으며, 대부분의 대규모 상업적 사용자들은 지속 가능성에 기여하지 않으면서 서비스를 소비하고 있다고 지적했다.최근 업계 데이터에 따르면, npm은 2024년에만 4.5조 패키지 다운로드를 제공할 것으로 예상되며, Python의 PyPI 레지스트리는 전년 대비 87% 성장했다. 재단들은 수요는 지수적으로 증가하는 반면, 자금 지원은 선형적으로만 증가한다고 경고했다.유료 접근 모델로의 전환재단들은 개인 개발자에게는 무료 접근을 유지하면서 상업적 단체에는 사용량에 비례한 기여를 요구하는 단계별 접근 시스템을 도입할 가능성을 시사했습니다. 제안된 해결책에는 상업적 파트너십, 성능 기반 접근 계층, 사용 분석과 같은 부가 가치 서비스가 포함됩니다.Eclipse 재단의 전무이사인 Mike Milinkovich는 그의 조직이 재정 증가는 없이 다운로드 수가 네 배가 늘었다고 IT Brew에 밝혔습니다. 그는 “수요와 수익을 연계하는 비즈니스 모델이 없다”고 말하며 현 모델을 “고장났다”고 표현했습니다.이 시점은 8월에 Python Software Foundation이 재정 요청이 40% 증가해 연 예산이 바닥나면서 사상 처음으로 지원금 프로그램을 중단한 결정과도 맞물립니다. 이 움직임은 전 세계 파이썬 콘퍼런스와 재단 지원에 의존하는 커뮤니티 이니셔티브에 영향을 미칩니다.이 공동 성명은 주요 오픈소스 인프라 제공자들이 지속 가능성을 위해 유료 접근 모델을 도입할 수 있다는 가장 명확한 경고를 나타냅니다. “아직 위기는 아니지만, 이는 중대한 전환점입니다”라고 재단들은 밝혔습니다.
995 조회
0 추천
2025.09.27 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입