Loading...

AI 뉴스

Anthropic, 30시간 연속 코딩 가능한 Claude Sonnet 4.5 공개

페이지 정보

작성자 xtalfi
작성일 2025.09.30 04:32
1,516 조회
0 추천
0 비추천

본문

a8a1b7e496e0800b10a4e49c82e0f025T9Yu.png

(퍼플렉시티가 정리한 기사)

앤트로픽은 월요일에 Claude Sonnet 4.5를 공개하며, 이 인공지능 모델이 자율 코딩 능력에서 획기적인 발전을 이뤘음을 강조했습니다. Claude Sonnet 4.5는 30시간 이상 연속으로 작업할 수 있는데, 이는 이전 모델보다 네 배 이상 오래 지속되는 것입니다.


샌프란시스코에 본사를 둔 이 AI 기업은 의 지원을 받고 있으며, 기업 가치는 1,830억 달러에 달합니다. 앤트로픽은 이번 신형 모델이 산업 벤치마크 전반의 성능을 바탕으로 “세계 최고의 코딩 모델”이라고 주장합니다. Claude Sonnet 4.5는 실제 프로그래밍 과제로 AI 모델을 평가하는 엄격한 소프트웨어 엔지니어링 시험인 SWE-Bench Verified에서 77.2%의 점수를 획득했습니다.

 

혁신적인 자율 역량


모델의 확장된 운영 능력은 5월 출시 당시 약 7시간 동안만 집중을 유지할 수 있었던 Claude Opus 4에서 획기적인 도약을 보여줍니다. 내부 테스트 동안 Claude Sonnet 4.5는 전체 채팅 애플리케이션을 자율적으로 개발했으며, 개발 과정 전반에 걸쳐 일관성을 유지하면서 약 11,000줄의 코드를 생성했습니다.


“Claude Sonnet 4.5는 우리의 기대를 새롭게 합니다—30시간 이상의 자율 코딩을 소화하며, 엔지니어들이 복잡한 아키텍처 작업을 몇 달씩 들여야 할 일을 대폭 단축된 시간 내에, 방대한 코드베이스 전반에서 일관성을 유지하면서 처리할 수 있도록 돕습니다,“라고 iGent AI의 CEO인 Sean Ward는 밝혔습니다.


이 모델은 또한 컴퓨터 상호작용 작업에서도 우수한 성능을 보여줬으며, OSWorld 벤치마크에서 61.4%의 점수를 획득해, 불과 4개월 전 Claude Sonnet 4가 기록한 42.2%에서 거의 20%포인트 향상된 결과를 보였습니다.

 

향상된 개발자 도구 및 안전 기능


순수한 코딩 성능을 넘어서, Claude Sonnet 4.5는 도구의 향상과 안전성 강화로 개발자 워크플로우에 중요한 개선을 도입했습니다. 이 모델은 이제 Claude Code에서 체크포인트를 지원하여, 개발자가 진행 상황을 저장하고 이전 상태로 되돌릴 수 있게 하였습니다. 이는 코딩 커뮤니티에서 가장 많이 요청된 기능 중 하나를 해결한 것입니다. 또한, 사용자들은 이제 대화 내에서 직접 코드 실행은 물론, 스프레드시트, 슬라이드, 문서 등 다양한 파일을 생성할 수 있습니다.


Anthropic은 이를 “지금까지 가장 정렬된 프런티어 모델”로 자리매김하며, 아첨, 기만, 권력 추구와 같은 문제적인 행동이 대폭 감소한 점을 강조하고 있습니다. 또한, 악의적인 행위자가 특별히 제작한 입력값을 통해 AI 시스템을 조작하려고 하는 프롬프트 인젝션 공격에 대한 방어도 한층 강화했습니다. 이러한 안전성 개선과 더불어 Claude Agent SDK가 출시되어, 개발자들이 Claude Code를 구동하는 것과 동일한 인프라를 활용하여, 메모리 관리, 권한 처리, 다중 서브에이전트 조정이 가능한 독자적인 자율 에이전트를 구축할 수 있게 됐습니다.

댓글 0
전체 1,265 / 296 페이지
Anthropic 은 100만 토큰 컨텍스를 처리하는 클로드4 를 발표했다. 이는 기존 처리량의 5배 규모이다.이를 통해 7.5만 줄 이상의 코드를 한번에 처리하거나 수십개의 연구논문을 분석하는 것이 가능해졌다고 발표했다.현재 Anthropic API 및 아마존 Bedrock 에서 퍼블릭으로 사용 가능하며, 조만간 구글 클라우드 Vertex AI에서도 사용이 가능할 예정이라고 한다.클로드 브래드 에이브럼스는 "이전에는 문제를 작은 조각으로 나눠야 했지만, 100만 토큰 컨텍스트 윈도우로 모델이 전체 맥락을 파악할 수 있게 됐다"라며 "2500페이지 분량의 텍스트도 쉽게 처리할 수 있다"고 밝혔다.이번 발표는 오픈AI가 최근 발표한 ChatGPT-5에 대항하기 위한 것으로 보인다.
2214 조회
0 추천
2025.08.13 등록
퍼플렉시티가 구글에게 크롬을 사겠다고 제안했다.는 보도가 월스트리저널을 통해 나왔다.https://www.wsj.com/tech/perplexity-ai-google-chrome-offer-5ddb7a22퍼플렉시티는 345억달러(47조8000억원)에 크롬을 인수하겠다고 구글에 제안했다고 12일(현지시간) 보도했다.퍼플렉시티는 구글 에게 보낸 서한에서 크롬 인수 제안이 “크롬을 유능하고 독립적인 운영자에게 맡김으로써 최고 수준의 공익에 부합하는 반독점 구제책을 만족시키기 위한 것”이라고 재언했다.퍼플렉시티의 이번 제안은 미 법원이 온라인 검색 시장 경쟁 회복을 위한 방안을 제시할 예정인 가운데 나왔다.워싱턴 D.C. 연방법원 판사는 지난해 8월 미 법무부가 제기한 검색 시장 반독점 소송에서 구글의 시장 지위를 불법적인 독점이라고 판결했다. 이어 지난 4월부터 독점 해소 방안에 대한 재판이 진행됐으며, 법무부는 방안 중 하나로 구글 크롬 매각을 제안한 바 있다.물론 구글이 이에 응할지는 회의적이다.
2278 조회
0 추천
2025.08.13 등록
오픈AI가 출시하고 불만이 많아진 GPT-5를 잘쓰기 위한 프롬프트 가이드를 공개했다.https://cookbook.openai.com/examples/gpt-5/gpt-5_prompting_guide?ref=blog.secondbrush.co.kr이 가이드에서는 모델을 학습하고 실제 작업에 적용해 온 경험을 바탕으로 모델 출력의 품질을 극대화하기 위한 프롬프트 팁을 다루고 있다.. 에이전트 작업 성능 향상, 명령어 준수 보장, 새로운 API 기능 활용, 프런트엔드 및 소프트웨어 엔지니어링 작업을 위한 코딩 최적화 등의 개념을 살펴보고, GPT-5를 활용한 AI 코드 편집기 Cursor의 프롬프트 튜닝 작업에 대한 핵심 인사이트도 제공한다고..가이드에 따르면,"모범 사례를 적용하고 가능한 한 표준 도구를 도입함으로써 상당한 성과를 거두었으며, 이 가이드와 저희가 개발한 프롬프트 최적화 도구가 GPT-5 사용의 발판이 되기를 바랍니다. 하지만 항상 그렇듯이 프롬프트는 모든 경우에 적용되는 것은 아니라는 점을 명심하십시오. 여기에 제시된 기반을 바탕으로 실험을 수행하고 반복하여 문제에 대한 최상의 해결책을 찾을 것을 권장합니다."라고 되어 있다.Goal: Get enough context fast.목표: 빠르게 충분한 콘텍스트를 얻는다.Parallelize discovery and stop as soon as you can act.탐색을 병렬로 진행하고, 행동할 수 있게 되면 즉시 중단한다.Method:방법:Start broad, then fan out to focused subqueries.먼저 넓게 시작하고, 이후에는 구체적인 하위 쿼리로 확장한다.In parallel, launch varied queries; read top hits per query. Deduplicate paths and cache; don’t repeat queries.다양한 쿼리를 병렬로 실행하고, 각 쿼리의 상위 결과를 읽는다. 경로는 중복 제거하고 캐시에 저장한다. 동일한 쿼리를 반복하지 않는다.Avoid over searching for context. If needed, run targeted searches in one parallel batch.콘텍스트를 지나치게 탐색하지 않는다. 필요할 경우, 한 번의 병렬 배치로 목표 검색을 수행한다.Early stop criteria:조기 중단 기준:You can name exact content to change.변경할 정확한 내용을 지정할 수 있다.Top hits converge (~70%) on one area/path.상위 결과의 약 70%가 한 영역 또는 경로로 모인다.Escalate once:한 번에 에스컬레이션한다:If signals conflict or scope is fuzzy, run one refined parallel batch, then proceed.신호가 상충하거나 범위가 불분명하면, 정제된 병렬 배치를 한 번 실행한 후 진행한다.Depth:깊이:Trace only symbols you’ll modify or whose contracts you rely on; avoid transitive expansion unless necessary.변경하거나 의존하는 심볼만 추적하고, 필요하지 않다면 전이적인 확장은 피한다.Loop:반복:Batch search → minimal plan → complete task.배치 검색 → 최소 계획 → 작업 완료.Search again only if validation fails or new unknowns appear. Prefer acting over more searching.검증에 실패하거나 새로운 미지의 요소가 나타난 경우에만 다시 검색한다. 추가 검색보다는 행동을 우선한다.
2423 조회
0 추천
2025.08.12 등록
Yomiuri Sues U.S. AI Startup over Use of Articles; Perplexity Allegedly Used Over 100,000 News Stories요미우리 신문 3개 자회사가 미국 AI 스타트업인 Perplexity를 상대로 기사와 이미지를 무단으로 이용했다며 소송을 제기했다미우리 측은 퍼플렉시티가 약 12만 건의 디지털 기사와 이미지를 무단으로 복제해 검색엔진 답변에 사용했다고 주장했다.신문사 측은 약 21억7000만 엔의 손해배상을 요구했으며, 기사와 이미지 무단 복제가 저작권법상 복제권 및 공중송신권을 침해했다고 주장했다. 신문사에 따르면, 퍼플렉시티는 기존 검색엔진과 달리 직접 답변을 제공해 언론사 사이트 유입 감소로 광고 수입이 줄었다고 했다.요미우리 측은 언론의 노력과 투자가 AI 기업에 무단으로 이용되고, 공정한 보도를 해치는 결과가 된다고 했다. 이에 대해 퍼플렉시티는 일본 내 오해에 유감을 표하며 사실관계 확인에 노력 중이고, 언론사와의 협력 의향을 밝혔다.요미우리는 이번 소송이 일본 언론사로서는 최초 사례라고 했다. 미국에서도 유사한 소송이 진행 중이라고 밝혔다.
2289 조회
0 추천
2025.08.12 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입