Loading...

AI 뉴스

Anthropic, 30시간 연속 코딩 가능한 Claude Sonnet 4.5 공개

페이지 정보

작성자 xtalfi
작성일 2025.09.30 04:32
55 조회
0 추천
0 비추천

본문

a8a1b7e496e0800b10a4e49c82e0f025T9Yu.png

(퍼플렉시티가 정리한 기사)

앤트로픽은 월요일에 Claude Sonnet 4.5를 공개하며, 이 인공지능 모델이 자율 코딩 능력에서 획기적인 발전을 이뤘음을 강조했습니다. Claude Sonnet 4.5는 30시간 이상 연속으로 작업할 수 있는데, 이는 이전 모델보다 네 배 이상 오래 지속되는 것입니다.


샌프란시스코에 본사를 둔 이 AI 기업은 의 지원을 받고 있으며, 기업 가치는 1,830억 달러에 달합니다. 앤트로픽은 이번 신형 모델이 산업 벤치마크 전반의 성능을 바탕으로 “세계 최고의 코딩 모델”이라고 주장합니다. Claude Sonnet 4.5는 실제 프로그래밍 과제로 AI 모델을 평가하는 엄격한 소프트웨어 엔지니어링 시험인 SWE-Bench Verified에서 77.2%의 점수를 획득했습니다.

 

혁신적인 자율 역량


모델의 확장된 운영 능력은 5월 출시 당시 약 7시간 동안만 집중을 유지할 수 있었던 Claude Opus 4에서 획기적인 도약을 보여줍니다. 내부 테스트 동안 Claude Sonnet 4.5는 전체 채팅 애플리케이션을 자율적으로 개발했으며, 개발 과정 전반에 걸쳐 일관성을 유지하면서 약 11,000줄의 코드를 생성했습니다.


“Claude Sonnet 4.5는 우리의 기대를 새롭게 합니다—30시간 이상의 자율 코딩을 소화하며, 엔지니어들이 복잡한 아키텍처 작업을 몇 달씩 들여야 할 일을 대폭 단축된 시간 내에, 방대한 코드베이스 전반에서 일관성을 유지하면서 처리할 수 있도록 돕습니다,“라고 iGent AI의 CEO인 Sean Ward는 밝혔습니다.


이 모델은 또한 컴퓨터 상호작용 작업에서도 우수한 성능을 보여줬으며, OSWorld 벤치마크에서 61.4%의 점수를 획득해, 불과 4개월 전 Claude Sonnet 4가 기록한 42.2%에서 거의 20%포인트 향상된 결과를 보였습니다.

 

향상된 개발자 도구 및 안전 기능


순수한 코딩 성능을 넘어서, Claude Sonnet 4.5는 도구의 향상과 안전성 강화로 개발자 워크플로우에 중요한 개선을 도입했습니다. 이 모델은 이제 Claude Code에서 체크포인트를 지원하여, 개발자가 진행 상황을 저장하고 이전 상태로 되돌릴 수 있게 하였습니다. 이는 코딩 커뮤니티에서 가장 많이 요청된 기능 중 하나를 해결한 것입니다. 또한, 사용자들은 이제 대화 내에서 직접 코드 실행은 물론, 스프레드시트, 슬라이드, 문서 등 다양한 파일을 생성할 수 있습니다.


Anthropic은 이를 “지금까지 가장 정렬된 프런티어 모델”로 자리매김하며, 아첨, 기만, 권력 추구와 같은 문제적인 행동이 대폭 감소한 점을 강조하고 있습니다. 또한, 악의적인 행위자가 특별히 제작한 입력값을 통해 AI 시스템을 조작하려고 하는 프롬프트 인젝션 공격에 대한 방어도 한층 강화했습니다. 이러한 안전성 개선과 더불어 Claude Agent SDK가 출시되어, 개발자들이 Claude Code를 구동하는 것과 동일한 인프라를 활용하여, 메모리 관리, 권한 처리, 다중 서브에이전트 조정이 가능한 독자적인 자율 에이전트를 구축할 수 있게 됐습니다.

댓글 0
전체 329 / 3 페이지
(퍼플렉시티가 정리한 기사)Google은 오늘 AI 코딩 어시스턴트 경쟁에서 중요한 수준의 격상을 이루며 Jules Tools를 출시했습니다. Jules Tools는 명령줄 인터페이스와 공용 API를 통해 Google의 자율 코딩 에이전트를 개발자 터미널, CI/CD 파이프라인, 그리고 Slack과 같은 업무 도구에 직접 내장합니다. 이 조치는 시장을 2천만 명 이상 사용자로 장악하고 있는 마이크로소프트의 GitHub Copilot에 맞서 구글이 가장 공격적으로 도전한 사례로 손꼽힙니다.목요일 발표된 Jules Tools 업데이트는 구글의 웹 기반 코딩 에이전트를 워크플로우에 최적화된 어시스턴트로 탈바꿈시켜, 개발자가 기존 개발 환경에서 스크립트 작성, 자동화, 통합까지 가능하게 지원합니다. 구글 랩스 제품 디렉터 Kathy Korevec는 “개발자들의 컨텍스트 전환을 최대한 줄이고자 한다”고 밝혔습니다.혼잡한 시장에서의 전략적 차별화구글의 시기는 AI 기반 개발 도구 시장의 경쟁이 치열해지는 가운데 나타난 것으로, GitHub Copilot이 77,000명의 비즈니스 고객을 확보하며 기업 시장에서의 우위를 유지하고 있다. 그러나 Jules는 자신을 다르게 위치시키고 있는데, 개발자의 지속적인 상호작용 없이 독립적으로 작동하는 자율 에이전트라는 점이다.구글의 기존 Gemini CLI 툴과는 달리, 반복적인 협업이 필요한 Gemini와 달리 Jules Tools는 개발자가 전체 코딩 업무를 완전히 위임할 수 있는 “매우 제한된 작업”을 위해 설계되었다. 이 에이전트는 실행 계획을 세우고, 클라우드 기반 가상 머신에서 독립적으로 작업을 실행하며, 오디오 요약과 함께 풀 리퀘스트를 제출한다—이는 개발자가 Jules가 일상적인 작업을 처리하는 동안 다른 업무에 집중할 수 있도록 해준다.새로운 CLI는 개발자가 jules remote new --repo와 같은 명령어로 터미널에서 직접 Jules를 트리거할 수 있도록 하며, 공개 API는 VSCode와 같은 IDE, 지속적 통합 시스템, 커스텀 워크플로우 등과의 통합 가능성을 열어준다. 구글은 이미 내부적으로 API를 테스트했으며, 이제 개발자들이 “익숙한 기존 워크플로우에 이 도구를 확장할 수 있도록” API를 제공한다고 Korevec은 설명했다.시장 환경과 경쟁 압력이번 출시는 기업들이 AI 코딩 어시스턴트 도입을 빠르게 가속화하는 가운데 이루어졌습니다. 가트너는 2024년 초 14% 미만이던 기업 소프트웨어 엔지니어 중 90%가 2028년까지 AI 코드 어시스턴트를 사용할 것이라고 예측합니다. 이러한 급증으로 인해 아마존 은 CodeWhisperer를, Anthropic은 Claude Code를, 그리고 Cursor와 같은 신생 스타트업들도 시장 점유율을 놓고 경쟁하고 있습니다.Jules는 8월 베타를 종료하면서 구조화된 요금제를 도입했는데, 일일 15개 작업을 제공하는 무료 플랜, 5배 더 높은 한도를 제공하는 월 $19.99의 Google AI Pro, 그리고 20배 용량을 제공하는 월 $124.99의 Google AI Ultra 등이 있습니다. 이러한 가격 전략은 개인 개발자뿐 아니라 “멀티 에이전트 워크플로우”가 필요한 기업 팀을 동시에 겨냥하고 있습니다.5월에 공식 출시된 이후, Jules는 “수천 명”의 개발자가 “수만 개”의 작업을 완료하도록 도왔으며, 140,000건 이상의 코드 업데이트가 공개적으로 공유되었습니다. 하지만 이 수치는 GitHub Copilot의 방대한 사용자 기반과 비교하면 아직 미미한 수준으로, 마이크로소프트가 GitHub 통합 생태계를 통해 상당한 이점을 유지하고 있는 시장에서 구글이 직면한 도전 과제를 부각시킵니다.
13 조회
0 추천
10.03 등록
(퍼플렉시티가 정리한 기사)Microsoft 연구진은 이번 주에 전 세계 생명보안 시스템에서 치명적인 취약점을 밝혀냈으며, 인공지능 단백질 설계 도구가 생물무기 개발을 방지하기 위해 고안된 안전성 검사망을 피해 치명적인 독소의 합성 버전을 만들어낼 수 있음을 시연했습니다.10월 2일 Science에 게재된 이번 연구는 AI가 위험한 단백질의 유전적 설계도를 “바꿔 말할 수” 있음을 드러냈습니다. 즉, DNA 합성 회사들이 전 세계적으로 사용하는 스크리닝 소프트웨어의 탐지를 피해, 치명적인 구조와 기능을 유지하면서 해당 유전자의 DNA 서열을 새로 작성할 수 있음을 보여준 것입니다.업계 간 협력이 중요한 격차를 메운다마이크로소프트 최고 과학 책임자 에릭 호르비츠(Eric Horvitz)가 이끄는 연구팀은 적군 모의훈련(red-teaming) 과정에서 독성 단백질과 바이러스성 단백질 등 7만 5천 개가 넘는 위험 단백질 변종을 생성하며, 이 과정에서 제로데이 취약점을 발견했다. AI가 설계한 서열들은 초기 테스트에서 표준 생명과학 보안 스크리닝 소프트웨어를 성공적으로 우회했으며, 호르비츠에 따르면 개조된 독성 단백질들은 “스크리닝 기술을 손쉽게 통과했다”고 한다.이 발견은 Twist Bioscience , Integrated DNA Technologies, 그리고 여러 생명과학 보안 스크리닝 소프트웨어 공급업체들이 참여한 긴급 10개월 협력의 계기가 되어, 보안 패치를 개발하고 배포했다. 업데이트 이후, 스크리닝 시스템은 AI가 생성한 가장 위험한 변종의 97%를 탐지하지만, 약 3%는 여전히 탐지를 피하고 있다.이중 용도 위험이 인공지능의 증가하는 생물학적 위협을 부각시키다이 취약점은 약물 발견과 의학 연구를 혁신하고 있는 동일한 AI 도구에서 비롯됩니다. 마이크로소프트는 자체 단백질 설계 소프트웨어인 EvoDiff와 기타 오픈소스 도구를 활용해 디지털 시뮬레이션에서 리친, 보툴리눔과 같은 독소를 변형했습니다. 실제 유독 단백질이 제조되지는 않았지만, 이번 연구는 생물 테러리스트가 AI를 이용해 보호 조치를 우회할 수 있는 잠재적 방법을 보여주었습니다.“AI의 발전이 생물학과 의학에서 돌파구를 만들어내고 있지만, 새로운 힘에는 경계와 신중한 위험 관리의 책임이 따릅니다.”라고 호르비츠는 언론 브리핑에서 말했습니다.트위스트 바이오사이언스(Twist Bioscience)의 CEO인 에밀리 르프루스트도 위협의 진화하는 특성을 강조했습니다. “AI 역량이 진화함에 따라, 스크리닝 방식도 그만큼 빠르게 진화해야 합니다.”. 남부 샌프란시스코에 본사를 둔 이 회사는 지난 10년 동안 수천 건의 DNA 합성 주문을 처리하는 가운데 다섯 건도 안 되는 의심스러운 주문만을 법 집행 기관에 넘겼습니다.
13 조회
0 추천
10.03 등록
(퍼플렉시티가 정리한 기사)중국의 한 기술 회사가 상하이 앞바다에 서버 팟을 잠수시키는 새로운 접근 방식으로 데이터 센터의 에너지 효율성을 개척하고 있습니다. 이는 인공지능 수요가 전 세계적으로 급증하는 가운데, 지속 가능한 컴퓨팅 인프라에서 중요한 발전을 의미합니다.하이클라우드 테크놀로지(HiCloud Technology)가 개발한 이 수중 데이터 센터 프로젝트는 해양 장비 회사 하이랜더(Highlander)의 자회사로서, 세계 최초 상업 규모의 풍력 기반 잠수형 서버 설치를 대표합니다. 이 이니셔티브는 6월에 건설을 시작했으며, 9월에 운영을 개시할 예정입니다. 이를 통해 중국은 혁신적인 데이터 인프라 솔루션 분야에서 선도적인 위치를 확보하게 될 것입니다.혁신적인 에너지 효율성 접근법상하이 시설은 천연 해수 냉각 시스템을 활용하여 기존 육상 데이터 센터와 비교해 에너지 소비를 획기적으로 줄였습니다. 하이클라우드(HiCloud) 대변인 리랑핑(Li Langping)은 이 시스템이 전체 전력 사용량에서 냉장 에너지 소비 비중을 기존 4050%에서 10% 이하로 낮추어, 총 에너지 사용량을 3040% 절감한다고 밝혔습니다.근처 해상 풍력 발전소에서 97%의 전력을 공급받는 수중 캡슐에는 198개의 서버 랙이 설치되어 있으며, 396~792대의 AI 준비 서버를 처리할 수 있습니다. 하이클라우드는 이 시설이 GPT-3.5와 동등한 모델을 하루 만에 학습할 수 있는 충분한 컴퓨팅 파워를 보유하고 있다고 주장합니다.Highlander 부사장 양예(Yang Ye)는 “수중 설치는 냉각 에너지 소비를 거의 90%까지 줄일 수 있다”고 강조하며, 수중 운영의 자연적 이점을 언급했습니다. 이 프로젝트는 1.15 이하의 전력 이용 효율(PUE)을 달성하는 것을 목표로 하며, 이는 중국 데이터 센터 평균 PUE 1.5에 비해 현저히 더 우수한 수치입니다.마이크로소프트의 기반 위에 구축하기이 중국의 이니셔티브는 마이크로소프트 의 프로젝트 나틱(Project Natick)을 기반으로 하고 있습니다. 프로젝트 나틱은 2018년 스코틀랜드 해안에서 수중 데이터 센터 개념을 테스트한 바 있습니다. 마이크로소프트의 2년간 실험 결과, 수중 서버는 육상 시설의 8분의 1 수준의 고장률을 보였으며, 이는 질소로 채워진 환경과 인간의 개입이 없었기 때문으로 분석되었습니다.하지만 마이크로소프트는 결국 프로젝트 나틱을 중단했습니다. 기술적으로는 성공적이었지만 상업적 배치에 있어 경제적, 운영적 도전 과제가 있었기 때문입니다. 중국의 접근 방식은 실험적 테스트에서 전면적인 상업적 구현으로 넘어가는 첫 번째 사례를 보여줍니다.환경적 고려사항 및 미래 확장이 프로젝트는 중국전신 및 국영 AI 컴퓨팅 기업들의 지원을 받아 클라이언트로 확보했습니다. 1단계에는 2.3메가와트 시범 시설에 2억 2,300만 달러가 투자되었으며, 2단계에서는 24메가와트로 확장할 계획입니다.환경적 우려는 열 방출로 인한 해양 생태계에 미칠 잠재적 영향과 관련하여 여전히 남아 있지만, 하이랜더는 주변 수온이 허용 가능한 범위 내에 머물렀다는 2020년 평가 결과를 인용합니다. 헐 대학교(University of Hull)의 해양 생태학자 앤드루 원트(Andrew Want)는 생태적 영향에 대한 충분한 연구가 부족하며, 특히 열 방출이 어떤 종은 끌어들이고 다른 종은 밀어낼 수 있다는 점에 대해 강조했습니다.이 상하이 프로젝트가 성공하면, 중국 해안선을 따라 수중 데이터 센터의 보다 폭넓은 배치를 촉진시켜 인공지능 기반 인프라의 증가하는 에너지 수요에 대응할 잠재적 해결책을 제공하는 동시에 지상 자원과 담수 공급에 대한 부담을 줄일 수 있습니다.
15 조회
0 추천
10.03 등록
(퍼플렉시티가 정리한 기사)삼성전자가 최근 한국 언론인 조선비즈의 보도에 따르면, 오랜 기대를 모았던 Project Moohan XR 헤드셋을 10월 22일 한국에서 출시할 예정이며, 사전 등록은 10월 15일부터 시작됩니다. 안드로이드 기반의 이 디바이스는 삼성이 확장현실(Extended Reality) 시장에 본격적으로 진출하는 첫 대형 프로젝트로, 애플의 Vision Pro와 직접 경쟁하는 제품으로 자리매김하고 있습니다.삼성이 애플의 XR 지배력에 도전하다헤드셋은 구글 및 퀄컴 과 협력하여 개발되었으며, 스냅드래곤 XR2+ Gen 2 칩셋이 탑재되고 구글의 Android XR 플랫폼을 기반으로 실행됩니다. 보도에 따르면, 이 기기는 소니의 1.3인치 마이크로 OLED 디스플레이를 탑재하며 해상도는 3552×3840으로, 눈당 약 1,364만 픽셀을 제공해 애플의 Vision Pro보다 눈당 약 200만 개 더 많은 픽셀을 구현합니다.삼성의 가격 전략은 애플의 $3,500 Vision Pro보다 크게 저렴하게 책정되어 있으며, Project Moohan은 미국에서 $1,800에서 $2,900 사이의 가격에 판매될 것으로 예상됩니다. 이 가격 책정은 헤드셋을 프리미엄이면서도 더 접근 가능한 XR 시장의 대안으로 포지셔닝합니다.출시는 당초 계획된 9월 29일 출시 일정에서 전략적으로 연기된 것입니다. ET News는 삼성이 “내부 마케팅 전략 조정 및 품질 보증” 문제로 출시를 연기했다고 보도했습니다. 삼성은 초기 약 10만 대를 생산할 계획이며, 시장 수요에 따라 생산량을 조정할 계획입니다.기능 및 시장 전략삼성 헤드셋은 하와이 마우이에서 열린 퀄컴 스냅드래곤 서밋에서 첨단 기능을 선보였으며, 삼성, 퀄컴, 구글, 마이크로소프트의 업계 임원들이 협력적 접근 방식을 시연했습니다. 이 기기는 시선 추적, 손 추적, 그리고 삼성 갤럭시 생태계와의 완벽한 통합 기능을 탑재하여, 사용자가 갤럭시 스마트폰으로 촬영한 3D 사진과 영상을 볼 수 있도록 합니다.삼성의 전략은 하드웨어를 넘어, 기존 갤럭시 기기 생태계를 활용해 XR 경험을 위한 콘텐츠 파이프라인을 구축하는 데 중점을 두고 있습니다. 최근 회사는 갤럭시 스마트폰 카메라에 3D 캡처 기능을 도입해 사용자가 차세대 헤드셋에서 볼 수 있는 공간 콘텐츠를 직접 만들 수 있게 했습니다.초기 출시 지역은 대한민국으로, 국내 출시 이후 점진적으로 타 시장으로 확대해 나갈 예정입니다. 이러한 신중한 접근 방식은 애플의 Vision Pro 전략과 유사하지만, 프리미엄 XR 시장에서의 도입 가속화를 목표로 훨씬 경쟁력 있는 가격 정책을 내세우고 있습니다.
21 조회
0 추천
10.03 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입