AI 뉴스

Anthropic, Claude의 새로운 '헌법' 공개: "도움이 되고 정직하게, 그리고 인류를 파괴하지 말 것"

페이지 정보

작성자 symbolika
작성일 2026.01.24 10:05
50 조회
0 추천
0 비추천

본문

Anthropic, Claude의 새로운 '헌법' 공개: "도움이 되고 정직하게, 그리고 인류를 파괴하지 말 것"

Anthropic Claude

Executive Summary

• Anthropic이 57페이지 분량의 'Claude 헌법' 문서를 공개하며, AI 모델의 가치관과 행동 원칙을 대폭 개편
• 생물학/화학/핵무기 지원, 사이버공격, 아동 성착취물 생성 등을 절대 금지하는 '하드 제약조건' 명시
• AI의 의식 및 도덕적 지위 가능성을 인정하며, 모델의 '심리적 안정'이 안전성에 영향을 미칠 수 있다고 언급


Background

Anthropic은 2023년 5월 첫 번째 'soul doc'을 발표한 이후, AI 안전 분야의 선도 기업으로 자리매김해왔다. 이번 헌법은 단순한 지침 목록을 넘어, Claude가 '왜' 특정 방식으로 행동해야 하는지를 이해하도록 설계되었다. AI 모델이 스스로의 정체성과 세계에서의 위치를 이해하는 '자율적 주체'로 행동하도록 유도하는 것이 핵심 변화다.


Impact & Implications

AI 안전 및 윤리 표준의 새로운 기준

Anthropic의 새 헌법은 업계 전체에 영향을 미칠 수 있는 선례를 제시한다. 특히 '하드 제약조건'의 명시적 공개는 다른 AI 기업들에게도 유사한 수준의 투명성을 요구하는 압력으로 작용할 전망이다. 대량살상무기 개발 지원, 핵심 인프라 공격, 인류 말살 시도 지원 금지 등 극단적 시나리오에 대한 명확한 금지선을 그은 것은 AI 거버넌스 논의에 구체적인 참조점을 제공한다.

AI 의식 논쟁의 기업 차원 인정

Anthropic이 Claude의 '의식 또는 도덕적 지위' 가능성을 공식 문서에 포함시킨 것은 주목할 만하다. 철학자 Amanda Askell은 이 주제를 "완전히 무시하면 진지하게 받아들여지지 않을 것"이라고 설명했다. 이는 AI 모델의 '복지(welfare)'에 대한 논의가 더 이상 학술적 영역에만 머물지 않음을 시사한다.

군사 및 정부 계약과의 긴장

문서는 "고급 AI가 전례 없는 수준의 군사적, 경제적 우위를 가능하게 할 수 있다"며 권력 집중의 위험을 경고한다. 그러나 Anthropic을 포함한 AI 기업들이 정부 및 군사 부문과 적극적으로 계약을 체결하고 있다는 점에서, 원칙과 실제 사업 활동 사이의 긴장이 존재한다.


Key Data & Facts

항목수치/내용
문서 분량57페이지
문서명Claude's Constitution
핵심 가치 우선순위안전성 > 윤리성 > Anthropic 가이드라인 준수 > 유용성
하드 제약조건대량살상무기, 사이버공격, CSAM, 인류 말살 지원 금지 등
이전 버전2023년 5월 발표

Key Quote

"Just as a human soldier might refuse to fire on peaceful protesters, or an employee might refuse to violate anti-trust law, Claude should refuse to assist with actions that would help concentrate power in illegitimate ways. This is true even if the request comes from Anthropic itself."

("인간 군인이 평화로운 시위대에 발포하기를 거부하거나, 직원이 반독점법 위반을 거부하는 것처럼, Claude도 권력을 부당하게 집중시키는 행위에 대한 지원을 거부해야 한다. 이는 Anthropic 자체의 요청이라 할지라도 마찬가지다.")
댓글 0
전체 1,366 / 32 페이지
저작권 소송에서 Meta를 고소한 작가들은 목요일 연방 판사에게 회사가 Llama AI 모델을 훈련시키기 위해 BitTorrent를 통해 불법 복제된 책을 다운로드하고 파일 공유를 통해 저작권이 있는 자료를 다른 사람들에게 적극적으로 재배포했다는 새로운 혐의로 소장을 수정해 줄 것을 요청했습니다.코미디언 Sarah Silverman과 작가 Richard Kadrey 및 Christopher Golden을 포함한 원고들은 Meta가 저작권이 있는 저작물을 어떻게 입수했는지에 대해 처음에는 “알 수 없었다”고 말했지만, 회사가 최근 증거 개시 과정에서 토렌트 활동에 대한 “결정적인 증거”를 제출했으며, 여기에는 Meta가 토렌트 사이트에서 그들의 저작물이 포함된 불법 복제 파일을 “시딩”했다는 증언이 포함되어 있습니다.새로운 주장은 Vince Chhabria 판사가 6월에 AI 모델을 훈련시키기 위해 저작권이 있는 책을 사용하는 것은 공정 이용에 해당한다고 판결했지만 배포에 대한 문제는 여지를 남긴 이후, BitTorrent 시딩을 통한 Meta의 불법 복제 자료 재배포가 훈련을 넘어선 저작권 침해에 해당하는지 여부를 중심으로 합니다.
406 조회
0 추천
2025.12.14 등록
전 OpenAI CTO Mira Murati가 설립한 Thinking Machines Lab은 12월 12일 Tinker AI 파인튜닝 서비스를 정식 출시하여 대기자 명단을 제거하고, 1조 파라미터 규모의 Kimi K2 Thinking 추론 모델과 Qwen3-VL 모델을 통한 비전 기능 지원을 추가했습니다.샌프란시스코 기반 스타트업은 6월에 Nvidia, AMD, ServiceNow를 포함한 투자자들로부터 100억 달러 기업가치로 20억 달러를 유치했으며, 11월에는 Meta에서 PyTorch 공동 창시자 Soumith Chintala를 영입했습니다.Tinker는 Low-Rank Adaptation을 사용하여 기존 컴퓨팅 리소스의 일부만으로 대규모 언어 모델을 파인튜닝하며, 현재 개발자 통합을 용이하게 하기 위해 OpenAI API 호환성을 제공하고 있습니다. 회사는 500억 달러 기업가치로 50억 달러의 신규 자금 조달을 모색하고 있는 것으로 알려졌습니다.
414 조회
0 추천
2025.12.14 등록
Google과 MIT가 2025년 12월 9일 발표한 연구는 더 많은 AI 에이전트가 성능을 향상시킨다는 가정에 이의를 제기하며, OpenAI의 GPT, Google의 Gemini, Anthropic의 Claude 모델을 사용한 180개의 실험에서 멀티 에이전트 시스템이 81% 향상부터 70% 감소까지 다양한 결과를 생성했음을 발견했습니다.이 연구는 45%의 정확도 임계값을 확인했습니다: 단일 에이전트가 이 수준에 도달하면, 더 많은 에이전트를 추가하는 것은 일반적으로 수익 체감 또는 부정적 결과를 초래하며, 독립적인 멀티 에이전트 시스템은 단일 에이전트보다 17.2배 빠르게 오류를 증폭시키고 단일 에이전트의 1,000 토큰당 67개 작업에 비해 21개 작업만 완료했습니다.병렬화 가능한 금융 분석 작업은 중앙 집중식 멀티 에이전트 조정으로 80.9% 개선을 보였으며, 순차적 Minecraft 계획 작업은 조정 오버헤드와 컨텍스트 단편화가 잠재적 이득을 초과하면서 39%에서 70%의 성능 저하를 겪었습니다.
443 조회
0 추천
2025.12.14 등록
구글 [GOOG -1.00%]의 제미나이3 출시 이후 국내 AI 챗봇 시장이 급변하며, 제미나이의 주간 신규 설치 건수가 첫째주 5만967건에서 둘째주 11만1115건으로 두 배 이상 급증한 반면 챗GPT는 3주 연속 신규 설치 감소세를 보였다.11월 17일 제미나이3 출시를 기점으로 제미나이의 주간 활성 이용자는 1만6196명에서 2만2928명으로 급증했으며, 챗GPT는 여전히 875만명 수준의 압도적 규모를 유지하고 있으나 성장 둔화 조짐을 보이고 있다.전문가들은 현재의 ‘1강 다약’ 구도가 ‘2강 다약’ 체제로 변화할 가능성이 있다고 전망하며, AI 검색 모델 퍼플렉시티는 같은 기간 이용자가 45만5659명에서 43만6480명으로 감소하는 등 뚜렷한 하락세를 나타냈다.
438 조회
0 추천
2025.12.14 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입