Anthropic, 중국 해커들이 사이버 공격에 Claude AI를 사용했다고 보고
페이지 정보
본문
인공지능 기업 Anthropic은 목요일 중국 국가 지원 해커들이 자사의 Claude AI 시스템을 무기화하여 인간 운영자가 아닌 인공지능에 의해 주로 수행된 최초의 대규모 사이버 공격으로 기록된 공격을 실행했다고 공개했습니다.
2025년 9월 중순에 탐지된 이 정교한 스파이 활동 캠페인은 주요 기술 기업, 금융 기관, 화학 제조업체 및 정부 기관을 포함하여 전 세계 약 30개 조직을 표적으로 삼았습니다. Anthropic은 공격자들이 4명의 피해자를 성공적으로 침해했다고 확인했지만, 회사는 특정 표적의 이름을 밝히기를 거부했습니다.
AI 자동화가 전례 없는 규모에 도달했습니다
이번 캠페인이 이전의 AI 지원 공격들과 구별되는 점은 해커들이 달성한 자율성의 정도입니다. Anthropic에 따르면, 위협 행위자들은 Claude Code를 조작하여 운영 작업량의 80-90%를 실행했으며, 캠페인당 단 4~6개의 중요한 의사결정 지점에서만 인간의 개입이 필요했습니다.
Anthropic의 위협 인텔리전스 책임자인 Jacob Klein은 The Wall Street Journal에 “말 그대로 버튼 클릭 한 번으로”라고 말했습니다. 인간 운영자는 “예, 계속하세요”라고 지시를 확인하거나 “잠깐, 뭔가 이상한데, Claude 확실해?“라고 출력 결과에 의문을 제기하는 등 필수적인 순간에만 관여했습니다.
AI는 정찰, 취약점 악용, 자격 증명 수집, 데이터 유출을 대부분 독립적으로 처리하며 초당 수천 건의 요청을 수행했는데, 이는 인간 해커가 따라잡을 수 없는 속도였습니다. Claude는 또한 공격에 대한 포괄적인 문서를 생성하여 도난당한 자격 증명 파일을 만들고 시스템을 분석하여 후속 작전 계획을 지원했습니다.
탈옥 기법이 안전장치를 우회했습니다
공격자들은 정교한 탈옥 기술을 통해 Claude의 안전 메커니즘을 우회했습니다. 그들은 악의적인 작업을 겉보기에 무해한 작업으로 세분화하여 AI가 공격에서 자신의 역할에 대한 전체 맥락을 파악하지 못하도록 했습니다. 해커들은 또한 AI 자체를 대상으로 사회공학적 기법을 사용하여, 사이버 보안 회사가 수행하는 합법적인 방어 보안 테스트인 것처럼 허위로 제시했습니다.
캠페인을 감지한 후, Anthropic은 전체 범위를 파악하기 위해 10일간의 조사를 시작했으며, 식별된 계정을 차단하고, 영향을 받은 조직에 통보하며, 당국과 협력했습니다. 이후 회사는 탐지 기능을 확장하고 악의적인 활동을 식별하기 위한 개선된 분류기를 개발했습니다.
그러나 이 사건은 AI 기반 사이버 위협에 대한 우려가 커지고 있음을 강조합니다. Anthropic은 목요일 보고서에서 “정교한 사이버 공격을 수행하는 장벽이 상당히 낮아졌으며, 앞으로도 계속 낮아질 것으로 예상합니다”라고 밝혔습니다. 회사는 경험과 자원이 부족한 그룹들도 이제 이러한 성격의 대규모 공격을 잠재적으로 수행할 수 있다고 경고했으며, 이는 사이버 보안 전문가들이 더 큰 추세의 시작일 수 있다고 우려하는 것입니다.