AI 뉴스

Anthropic, 30시간 연속 코딩 가능한 Claude Sonnet 4.5 공개

페이지 정보

작성자 xtalfi
작성일 2025.09.30 04:32
595 조회
0 추천
0 비추천

본문

a8a1b7e496e0800b10a4e49c82e0f025T9Yu.png

(퍼플렉시티가 정리한 기사)

앤트로픽은 월요일에 Claude Sonnet 4.5를 공개하며, 이 인공지능 모델이 자율 코딩 능력에서 획기적인 발전을 이뤘음을 강조했습니다. Claude Sonnet 4.5는 30시간 이상 연속으로 작업할 수 있는데, 이는 이전 모델보다 네 배 이상 오래 지속되는 것입니다.


샌프란시스코에 본사를 둔 이 AI 기업은 의 지원을 받고 있으며, 기업 가치는 1,830억 달러에 달합니다. 앤트로픽은 이번 신형 모델이 산업 벤치마크 전반의 성능을 바탕으로 “세계 최고의 코딩 모델”이라고 주장합니다. Claude Sonnet 4.5는 실제 프로그래밍 과제로 AI 모델을 평가하는 엄격한 소프트웨어 엔지니어링 시험인 SWE-Bench Verified에서 77.2%의 점수를 획득했습니다.

 

혁신적인 자율 역량


모델의 확장된 운영 능력은 5월 출시 당시 약 7시간 동안만 집중을 유지할 수 있었던 Claude Opus 4에서 획기적인 도약을 보여줍니다. 내부 테스트 동안 Claude Sonnet 4.5는 전체 채팅 애플리케이션을 자율적으로 개발했으며, 개발 과정 전반에 걸쳐 일관성을 유지하면서 약 11,000줄의 코드를 생성했습니다.


“Claude Sonnet 4.5는 우리의 기대를 새롭게 합니다—30시간 이상의 자율 코딩을 소화하며, 엔지니어들이 복잡한 아키텍처 작업을 몇 달씩 들여야 할 일을 대폭 단축된 시간 내에, 방대한 코드베이스 전반에서 일관성을 유지하면서 처리할 수 있도록 돕습니다,“라고 iGent AI의 CEO인 Sean Ward는 밝혔습니다.


이 모델은 또한 컴퓨터 상호작용 작업에서도 우수한 성능을 보여줬으며, OSWorld 벤치마크에서 61.4%의 점수를 획득해, 불과 4개월 전 Claude Sonnet 4가 기록한 42.2%에서 거의 20%포인트 향상된 결과를 보였습니다.

 

향상된 개발자 도구 및 안전 기능


순수한 코딩 성능을 넘어서, Claude Sonnet 4.5는 도구의 향상과 안전성 강화로 개발자 워크플로우에 중요한 개선을 도입했습니다. 이 모델은 이제 Claude Code에서 체크포인트를 지원하여, 개발자가 진행 상황을 저장하고 이전 상태로 되돌릴 수 있게 하였습니다. 이는 코딩 커뮤니티에서 가장 많이 요청된 기능 중 하나를 해결한 것입니다. 또한, 사용자들은 이제 대화 내에서 직접 코드 실행은 물론, 스프레드시트, 슬라이드, 문서 등 다양한 파일을 생성할 수 있습니다.


Anthropic은 이를 “지금까지 가장 정렬된 프런티어 모델”로 자리매김하며, 아첨, 기만, 권력 추구와 같은 문제적인 행동이 대폭 감소한 점을 강조하고 있습니다. 또한, 악의적인 행위자가 특별히 제작한 입력값을 통해 AI 시스템을 조작하려고 하는 프롬프트 인젝션 공격에 대한 방어도 한층 강화했습니다. 이러한 안전성 개선과 더불어 Claude Agent SDK가 출시되어, 개발자들이 Claude Code를 구동하는 것과 동일한 인프라를 활용하여, 메모리 관리, 권한 처리, 다중 서브에이전트 조정이 가능한 독자적인 자율 에이전트를 구축할 수 있게 됐습니다.

댓글 0
전체 583 / 35 페이지
(퍼플렉시티가 정리한 기사)Stellantis와 중국 자율주행 기업 Pony.ai는 오늘 유럽 전역에 로보택시를 배치하기 위한 파트너십을 발표했으며, 이는 자율주행 차량 시장의 경쟁이 심화되는 가운데 네덜란드 자동차 제조업체와 주요 중국 로보택시 운영업체 간의 첫 번째 협력을 의미합니다.​양사는 Pony.ai의 자율주행 소프트웨어를 Stellantis의 중형 전기 밴 플랫폼과 통합하기 위한 법적 구속력이 없는 양해각서를 체결했으며, 특히 Stellantis가 Pro One 상용차 부문을 통해 유럽에서 선도적 위치를 차지하고 있는 경형 상용차 부문을 목표로 하고 있습니다.룩셈부르크에서 테스트 시작초기 테스트는 Peugeot e-Traveller 모델을 사용하여 앞으로 몇 달 내에 룩셈부르크에서 시작될 예정이며, 두 회사는 2026년부터 유럽 도시 전역에 걸쳐 점진적인 출시를 계획하고 있습니다. 룩셈부르크는 Pony.ai의 유럽 지사 본부이며, 간소화된 규제 환경을 갖춘 유럽의 자율주행 모빌리티 허브로 자리매김했습니다.​Stellantis의 최고 엔지니어링 및 기술 책임자인 Ned Curic은 "무인 자동차는 우리 도시에서 사람들이 이동하는 방식을 변화시킬 잠재력을 가지고 있으며, 지역 사회에 더 안전하고 저렴한 옵션을 제공합니다"라고 말했습니다. 이 파트너십은 손을 떼고 눈을 뗀 상태로 운행이 가능한 SAE 레벨 4 자율주행 기능을 위해 설계된 Stellantis의 AV-Ready 플랫폼을 활용합니다.중국의 유럽 진출이번 발표는 중국 로보택시 기업들이 해외 진출을 가속화하는 가운데 나왔다. Pony.ai는 유럽 시장을 목표로 하는 경쟁사 Baidu 및 WeRide와 합류하며, Baidu는 내년 독일과 영국에 로보택시를 배치하기 위해 Lyft와 파트너십을 맺었다. WeRide는 이미 프랑스와 싱가포르를 포함한 10개국 30개 이상의 도시에서 운영 중이다.​Pony.ai는 현재 500대 이상의 로보택시를 운영하고 있으며 베이징, 광저우, 선전을 포함한 중국 주요 도시에서 연중무휴 상업 운영을 달성했다. 이 회사는 자사의 자율주행 시스템이 5천만 킬로미터 이상의 테스트를 거쳐 인간 운전자보다 최대 10배 우수한 안전 기록을 달성했다고 주장한다.​유럽 로보택시 시장은 2024년 3억 9,460만 달러에서 2030년까지 86억 달러로 성장할 것으로 예상되며, 이는 연평균 72.7%의 성장률을 나타낸다. 이러한 급속한 확장은 전 세계 기업들이 자율주행 차량 서비스를 구축하기 위해 경쟁하는 가운데 이루어지고 있으며, Waymo도 2026년까지 런던에서 테스트를 진행할 계획을 발표했다.
265 조회
0 추천
10.18 등록
Wikipedia Traffic Plummets 8% as AI Siphons Visitors, Threatening Its Future위키미디어 재단은 위키피디아에 대한 트래픽이 8% 감소했다고 밝히고, 생성 AI와 검색 엔진이 방문자를 빨아들이고 지속 가능성을 위협한다고 문제를 제기.위키미디어 재단은 위키피디아에 대한 인간 방문자의 현저한 감소에 대해 경보를 울렸다. 10월 17일 성명에서 비영리 단체는 2024년 같은 기간에 비해 지난 몇 달 동안 페이지 뷰가 8% 감소했다고 밝혔다.재단은 호황을 누리고 있는 생성형 AI 산업을 직접 겨누고 있다. 검색 엔진과 AI 챗봇은 위키피디아의 방대한 지식 저장소를 점점 더 긁어모으고 요약하여 사용자에게 직접적인 답변을 제공합니다. 이러한 편리함은 소스로부터 트래픽을 빼내는 대가를 치르게 된다.이러한 경향은 크라우드소싱 백과사전의 기초를 위협한다. 재단은 이러한 감소가 단순한 허영심 지표가 아니라 플랫폼의 장기적인 지속 가능성에 대한 중대한 위험을 나타낸다고 경고합니다.위키미디어의 제품 수석 이사인 마샬 밀러는 "위키피디아에 대한 방문이 줄어들면 자원 봉사자가 더 적고 콘텐츠를 성장시키고 풍부하게 할 수 있으며, 이 작업을 지원하는 개인 기부자가 줄어듭니다."라고 지적했다.
277 조회
0 추천
10.18 등록
(퍼플렉시티가 정리한 기사)대한상공회의소와 국회입법조사처가 17일 공동 개최한 ‘한-미 혁신생태계 및 AI 미래전략’ 세미나에서 한국의 인공지능(AI) 투자 규모가 미국의 80분의 1 수준에 그치고 있어 투자 확대와 규제 개선이 시급하다는 지적이 제기됐다.미국 더 베이 카운슬 경제연구소의 션 란돌프 시니어 디렉터는 “2024년 기준 미국의 AI 민간 투자 규모는 1090억 달러로 한국(13억 달러)의 80배가 넘는다”고 밝혔다. 이는 한국보다 경제 규모가 작은 스웨덴(43억 달러), 아랍에미리트(18억 달러), 오스트리아(15억 달러)보다도 적은 수준이다.실리콘밸리 집중 현상과 한국의 위기란돌프 디렉터는 “2024년 전세계 벤처 투자액 중 AI 분야가 37%를 차지했으며, 특히 미국 내 AI 투자의 76%가 실리콘밸리를 포함한 샌프란시스코 지역에 집중됐다”고 설명했다. 샌프란시스코 지역의 AI 스타트업 투자 건수는 973건으로 2위인 뉴욕의 3.5배에 달한다.투자 격차는 AI 성능 차이로 직결되고 있다. 스탠퍼드대 AI연구소가 기술 수준을 바탕으로 집계한 ‘주목할 만한 AI 모델’ 수에서 미국은 40개, 중국은 15개를 기록한 반면 한국은 1개에 그쳤다. 한국의 AI 투자 순위는 지난해 9위에서 11위로 하락했다.규제 개선과 투자 확대 필요성 대두정준화 국회입법조사처 입법조사관은 “미국은 민간기업인 OpenAI 한 곳에서만 2024년 기준 GPU 모듈 H100을 72만장 가동하는 반면, 한국 정부가 최근 추경을 통해 확보한 최신 GPU는 1만3천장에 불과하다”며 투자 규모의 현격한 격차를 지적했다.강석구 대한상의 조사본부장은 “국내 AI 생태계를 구축하고 한국형 AI 유니콘 기업을 육성하기 위해서는 금산분리 규제 등 투자를 제약하는 경직적인 규제를 개선하는 것이 시급하다”고 강조했다. 전문가들은 △AI 기업과 시장 성장을 위한 과감한 규제 혁신 △공공부문 인공지능 전환 확산을 통한 시장수요 촉진 △민간 투자에 대한 인센티브 강화 등을 핵심 전략으로 제시했다.
290 조회
0 추천
10.17 등록
(퍼플렉시티가 정리한 기사)Microsoft는 목요일에 Dragon Copilot 임상 보조 도구의 대대적인 확장을 발표하며, 간호 업무 흐름을 위해 특별히 설계된 최초의 상업적으로 이용 가능한 앰비언트 AI 경험을 선보였습니다. 이번 조치는 전국의 간호사들이 전례 없는 수준의 번아웃과 싸우는 동시에 근무 시간의 25% 이상을 소비하는 문서화 부담으로 고군분투하는 의료 분야의 핵심적인 문제점을 해결합니다.이 기술 대기업은 간호 중심 기능과 함께 의료 파트너들이 제3자 AI 애플리케이션을 Dragon Copilot에 직접 통합할 수 있는 새로운 확장성 기능을 공개했으며, 회사 임원들은 이를 임상 업무 흐름 자동화를 위한 통합 생태계라고 설명합니다.문서화 위기 대응이번 확대는 간호 직종이 심화되는 인력 위기에 직면한 가운데 이루어졌습니다. 최근 조사에 따르면 간호사의 65%가 높은 수준의 스트레스와 번아웃을 겪고 있으며, 문서 작업과 행정 업무가 직무 불만족의 주요 원인으로 나타났습니다. 2022년 이후 138,000명 이상의 간호사가 현장을 떠났으며, 현직 간호사의 거의 40%가 향후 5년 내에 퇴직할 의향이 있는 것으로 나타났습니다.“Microsoft는 Dragon Copilot을 의료 제공 기관을 위한 선도적인 전사적 AI 임상 보조 도구로 계속 발전시키고 있으며, 이제 전문화된 간호 워크플로우 지원과 타사 AI 확장 생태계를 추가했습니다”라고 Microsoft Health and Life Sciences의 기업 부사장 겸 최고운영책임자인 Mary Varghese Presti가 말했습니다.Dragon Copilot의 간호 기능은 앰비언트 리스닝 기술을 사용하여 진료 현장에서 간호사-환자 상호작용을 포착한 다음, 대화를 자동으로 검토 및 전자 건강 기록으로 전송할 수 있는 플로우시트 문서로 변환합니다. 이 시스템은 또한 신뢰할 수 있는 의료 자원에 대한 액세스를 제공하고 기록 작성 및 환자 상호작용 요약과 같은 일상적인 작업을 자동화합니다.헬스케어 파트너 생태계이번 발표는 또한 Elsevier, Wolters Kluwer UpToDate, Canary Speech, Rhyme 등의 회사와의 파트너십을 통해 의료 AI를 위한 통합 플랫폼을 만들려는 Microsoft의 전략을 강조했습니다. 이러한 통합을 통해 임상의들은 임상 의사결정 지원부터 자동화된 사전 승인에 이르기까지 워크플로를 벗어나지 않고도 전문화된 기능에 액세스할 수 있습니다.Baptist Health는 Dragon Copilot을 통한 음성 바이오마커 분석을 위해 Canary Speech 통합을 테스트하는 초기 도입자 중 하나입니다. Baptist Health의 최고 의료 정보 책임자인 Brett Oliver 박사는 “Microsoft가 Dragon Copilot으로 만들고 있는 생태계는 의료 분야에서 확장 가능한 혁신을 위해 필수적입니다”라고 말했습니다. “고립된 포인트 솔루션에 의존하는 대신, 우리는 통합된 앰비언트 워크플로 내에서 여러 도구를 채택할 수 있습니다”.간호사 전용 기능은 2025년 12월부터 미국에서 일반 공급될 예정이며, 파트너 생태계는 수익 주기 관리, 환자 경험 모니터링 및 가상 진료 통합을 위한 애플리케이션으로 계속 확장되고 있습니다.
291 조회
0 추천
10.17 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입