AI 뉴스

Anthropic, 30시간 연속 코딩 가능한 Claude Sonnet 4.5 공개

페이지 정보

작성자 xtalfi
작성일 2025.09.30 04:32
49 조회
0 추천
0 비추천

본문

a8a1b7e496e0800b10a4e49c82e0f025T9Yu.png

(퍼플렉시티가 정리한 기사)

앤트로픽은 월요일에 Claude Sonnet 4.5를 공개하며, 이 인공지능 모델이 자율 코딩 능력에서 획기적인 발전을 이뤘음을 강조했습니다. Claude Sonnet 4.5는 30시간 이상 연속으로 작업할 수 있는데, 이는 이전 모델보다 네 배 이상 오래 지속되는 것입니다.


샌프란시스코에 본사를 둔 이 AI 기업은 의 지원을 받고 있으며, 기업 가치는 1,830억 달러에 달합니다. 앤트로픽은 이번 신형 모델이 산업 벤치마크 전반의 성능을 바탕으로 “세계 최고의 코딩 모델”이라고 주장합니다. Claude Sonnet 4.5는 실제 프로그래밍 과제로 AI 모델을 평가하는 엄격한 소프트웨어 엔지니어링 시험인 SWE-Bench Verified에서 77.2%의 점수를 획득했습니다.

 

혁신적인 자율 역량


모델의 확장된 운영 능력은 5월 출시 당시 약 7시간 동안만 집중을 유지할 수 있었던 Claude Opus 4에서 획기적인 도약을 보여줍니다. 내부 테스트 동안 Claude Sonnet 4.5는 전체 채팅 애플리케이션을 자율적으로 개발했으며, 개발 과정 전반에 걸쳐 일관성을 유지하면서 약 11,000줄의 코드를 생성했습니다.


“Claude Sonnet 4.5는 우리의 기대를 새롭게 합니다—30시간 이상의 자율 코딩을 소화하며, 엔지니어들이 복잡한 아키텍처 작업을 몇 달씩 들여야 할 일을 대폭 단축된 시간 내에, 방대한 코드베이스 전반에서 일관성을 유지하면서 처리할 수 있도록 돕습니다,“라고 iGent AI의 CEO인 Sean Ward는 밝혔습니다.


이 모델은 또한 컴퓨터 상호작용 작업에서도 우수한 성능을 보여줬으며, OSWorld 벤치마크에서 61.4%의 점수를 획득해, 불과 4개월 전 Claude Sonnet 4가 기록한 42.2%에서 거의 20%포인트 향상된 결과를 보였습니다.

 

향상된 개발자 도구 및 안전 기능


순수한 코딩 성능을 넘어서, Claude Sonnet 4.5는 도구의 향상과 안전성 강화로 개발자 워크플로우에 중요한 개선을 도입했습니다. 이 모델은 이제 Claude Code에서 체크포인트를 지원하여, 개발자가 진행 상황을 저장하고 이전 상태로 되돌릴 수 있게 하였습니다. 이는 코딩 커뮤니티에서 가장 많이 요청된 기능 중 하나를 해결한 것입니다. 또한, 사용자들은 이제 대화 내에서 직접 코드 실행은 물론, 스프레드시트, 슬라이드, 문서 등 다양한 파일을 생성할 수 있습니다.


Anthropic은 이를 “지금까지 가장 정렬된 프런티어 모델”로 자리매김하며, 아첨, 기만, 권력 추구와 같은 문제적인 행동이 대폭 감소한 점을 강조하고 있습니다. 또한, 악의적인 행위자가 특별히 제작한 입력값을 통해 AI 시스템을 조작하려고 하는 프롬프트 인젝션 공격에 대한 방어도 한층 강화했습니다. 이러한 안전성 개선과 더불어 Claude Agent SDK가 출시되어, 개발자들이 Claude Code를 구동하는 것과 동일한 인프라를 활용하여, 메모리 관리, 권한 처리, 다중 서브에이전트 조정이 가능한 독자적인 자율 에이전트를 구축할 수 있게 됐습니다.

댓글 0
전체 326 / 5 페이지
오픈AI가 ChatGPT 에 더이상 레딧을 참고하지 않는다는 소식이 알려졌다.또한 마케팅 전략가 안드레아보소니가 X에 아래와 같은 트윗과 함께Apparently ChatGPT is not using Reddit much anymore for their answers. I guess they realized that what random people say can’t be considered a trusted source after all. You can all stop spamming it with your fake brand mentions now.레딧의 트래픽이 줄어든 것으로 보이는 그래프를 올렸다.원래 챗GPT는 지난해 5월 레딧과 파트너십을 맺고 레딧의 콘텐츠를 사용해 왔다.하지만 레딧에 올라온 게시글의 진위와 품질에 문제를 제기하는 경우가 늘어나면서 챗GPT가 이러한 결정을 하게 된 것으로추측된다. 이로써 레딧의 트래픽이 줄어들었고, 주가도 크게 하락했다고.
19 조회
0 추천
10.02 등록
비즈니스 인사이더는 바이브 코딩에 대한 관심이 떨어지고 있는 것으로 보인다고 보도했다.AI 기술로 텍스트 프롬프트만으로 앱이나 웹사이트를 만들 수 있는 바이브 코딩 툴들의 사용 트래픽이 올해 초 정점을 찍은 뒤 최근 급격히 감소하는 추세를 보이고 있습니다.Lovable, Vercel의 v0 등 대표적인 바이브 코딩 서비스들의 트래픽이 각각 40%, 64% 하락하는 등 눈에 띄는 감소가 나타나고 있습니다. Bolt.new와 Replit도 각각 27%, 소폭 감소를 기록했습니다.많은 스타트업들이 매출(ARR) 급증을 내세웠지만, 월 단위 구독자 이탈이 높아 수익성에 의문이 제기되고 있습니다. 특히 헤비 유저의 높은 비용 부담과 가격 인상 등이 신규 고객 유입과 유지에 장애가 되고 있습니다. Bolt.new는 고객 이탈을 막기 위해 신규 기능과 구독 모델을 도입하는 등 대응에 나서고 있고, Wix·GoDaddy와 같은 기존 대형 업체들도 인수합병이나 신규 서비스 도입으로 시장 가능성을 모색하고 있습니다.바이브 코딩 툴은 현재 AI 친화적인 얼리어답터 중심의 실험 단계에 머물러 있으면, '마지막 5%'의 완성도 문제 등 대중화에는 한계가 있다는 평가입니다. 다만, 관련 논의와 시장은 당분간 지속될 것으로 보입니다.
19 조회
0 추천
10.02 등록
OpenAI가 최근 초대제로 공개한 틱톡 스타일 소셜 앱 'Sora'가 출시 하루 만에 매우 사실적인 샘 올트먼 딥페이크 영상이 급속히 퍼지고 있다. 사용자는 올트먼이 가상 돼지농장, 포켓몬 필드 등에서 기상천외한 행동을 하는 모습을 볼 수 있으며, 저작권 침해가 의심되는 콘텐츠가 다수 포함되어 있다.'Sora'의 핵심 기능 중 하나는 사용자 본인의 얼굴 데이터를 업로드해 '카메오' 영상, 즉 자가 딥페이크를 만들 수 있다는 점이다. 초기 등록 과정에서 카메오 생성 가능 대상을 '나만', '승인된 사람', '상호 친구', '모든 사람' 등으로 선택할 수 있으며, 샘 올트먼은 모든 사용자에게 카메오 허용을 해 논란이 커지고 있다.앱은 부적절한 복장이나 상황을 걸러내는 안전 장치를 가지고 있지만, 실제로 완벽하게 이를 막지 못하는 사례도 발견되었다. 사용자는 자신의 딥페이크를 쉽게 만들어 공개할 수 있고, IP 및 ChatGPT 사용 이력 등 개인정보 기반에서 추천 영상이 만들어진다.앱은 콘텐츠 저작권자에게 명시적 동의가 없어도 자료를 사용할 수 있게 설계되어 법적·윤리적 문제가 제기되고 있다. 유명 인물이나 캐릭터를 무분별하게 활용한 영상이 급속히 확산되며, 저작권자들이 직접 미사용 요청을 해야만 해당 자료 사용이 제한된다.딥페이크 기술이 대중화되며 사기, 괴롭힘, 허위 정보 유포 등 부작용의 우려가 커지고 있다. 실제로 대통령 도널드 트럼프도 자신의 SNS에 민주당 의원 딥페이크 영상을 올리는 등 정치적 악용 사례가 발생 중이며, Sora가 대중에게 완전히 공개될 경우 사회적 파장이 뒤따를 것으로 예상된다.
23 조회
0 추천
10.02 등록
(퍼플렉시티가 정리한 기사)코인베이스 의 임원 존 다고스티노는 인공지능 에이전트가 금융 시장에서 효과적으로 작동하기 위해서는 암호화폐 인프라가 필요하다고 주장하면서, 전통적인 은행 시스템을 구식 기술에 비유했다. 그의 발언은 AI와 블록체인 기술의 융합이 가속화되고 있음을 강조했다.화요일 CNBC의 스쿼크박스에서 코인베이스 기관 전략 책임자인 다고스티노는 AI를 “무한히 확장 가능한 지능”으로, 블록체인을 “무한히 확장 가능한 진실의 원천”으로 묘사하며 두 기술의 자연스러운 호환성을 강조했다. 그의 발언은 AI 암호화폐 분야의 시가총액이 약 300억 달러에 달할 정도로 폭발적으로 성장하고, 기관 투자자들이 2025년 4분기 이전에 자율 거래 시스템을 도입하기 위해 경쟁하고 있는 가운데 나왔다.전통 금융은 인공지능의 속도를 따라잡을 수 없다다고스티노는 수십 년 전에 개발된 인프라에 기반을 둔 기존 금융 시스템이 AI 에이전트가 요구하는 실시간 기계 간 거래를 처리할 수 없다고 강조했다. 그는 “영화를 다이얼업 모뎀으로 스트리밍하려고 하지는 않을 것”이라며 “이 AI 에이전트들에게 그 모뎀보다 더 오래된 금융 시스템에서 거래하라고 요구하지도 않을 것”이라고 말했다.이 임원은 AI 에이전트가 인간 트레이더와 달리 정보를 확인하기 위해 멈추지 않고 초당 수천 건의 결정을 내린다고 경고했다. 다고스티노는 CNBC와의 인터뷰에서 “AI 에이전트가 사람을 대신해 운영된다면, ‘진정한 정보 출처’에 기반해 작동해야 한다. 그렇지 않으면 재앙이 될 수 있다”고 말했다.AI 에이전트는 이미 암호화폐 플랫폼 전반에 널리 퍼져 있으며, 이들은 Web3 애플리케이션을 구축하고, 토큰을 출시하며, 서비스 및 프로토콜과 자율적으로 상호작용하고 있다. 일부 플랫폼에서는 트레이딩을 위한 AI 에이전트를 실험하고 있는데, 이는 해당 기술이 금융 시장에 점점 더 통합되고 있음을 보여준다.AI-암호화폐 통합의 급속한 성장융합이 빠르게 가속화되고 있습니다. 최근 데이터에 따르면 투자 매니저의 54%가 이미 인공지능(AI)을 연구 프로세스에 적용하고 있습니다. AI 기반 트레이딩 봇은 현재 일일 암호화폐 거래량의 약 40%를 차지하고 있으며, AI 관련 온체인 활동은 2025년 1월 이후 86% 급증하여 450만 명의 일일 사용자가 AI 기반 탈중앙화 애플리케이션과 상호작용하고 있습니다.D’Agostino는 또한 비트코인이 금보다 가지는 강점에 대해 논의하며, 비트코인이 “프로그래밍 가능하고, 디지털이며, 이동 측면에서 무한하게 확장 가능하다”고 강조한 뒤, 금리가 하락함에 따라 암호화폐에 대해 낙관적인 입장을 유지했습니다. 그러나 그는 갑작스러운 기관의 도입에 대한 기대를 경계하며, 연기금과 기금들이 “매우 조심스러우며”, “무모하게 뛰어드는 렘밍과는 다르다”고 설명했습니다.이 발언은 주요 암호화폐 기업들이 블록체인 기술을 다음 세대 AI 기반 금융 서비스의 필수 인프라로 삼으며, 업계가 빠르게 주류 금융으로 확장되고 있음을 강조합니다.
18 조회
0 추천
10.02 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입