Loading...

AI 뉴스

Anthropic, Claude의 새로운 '헌법' 공개: "도움이 되고 정직하게, 그리고 인류를 파괴하지 말 것"

페이지 정보

작성자 symbolika
작성일 01.24 10:05
33 조회
0 추천
0 비추천

본문

Anthropic, Claude의 새로운 '헌법' 공개: "도움이 되고 정직하게, 그리고 인류를 파괴하지 말 것"

Anthropic Claude

Executive Summary

• Anthropic이 57페이지 분량의 'Claude 헌법' 문서를 공개하며, AI 모델의 가치관과 행동 원칙을 대폭 개편
• 생물학/화학/핵무기 지원, 사이버공격, 아동 성착취물 생성 등을 절대 금지하는 '하드 제약조건' 명시
• AI의 의식 및 도덕적 지위 가능성을 인정하며, 모델의 '심리적 안정'이 안전성에 영향을 미칠 수 있다고 언급


Background

Anthropic은 2023년 5월 첫 번째 'soul doc'을 발표한 이후, AI 안전 분야의 선도 기업으로 자리매김해왔다. 이번 헌법은 단순한 지침 목록을 넘어, Claude가 '왜' 특정 방식으로 행동해야 하는지를 이해하도록 설계되었다. AI 모델이 스스로의 정체성과 세계에서의 위치를 이해하는 '자율적 주체'로 행동하도록 유도하는 것이 핵심 변화다.


Impact & Implications

AI 안전 및 윤리 표준의 새로운 기준

Anthropic의 새 헌법은 업계 전체에 영향을 미칠 수 있는 선례를 제시한다. 특히 '하드 제약조건'의 명시적 공개는 다른 AI 기업들에게도 유사한 수준의 투명성을 요구하는 압력으로 작용할 전망이다. 대량살상무기 개발 지원, 핵심 인프라 공격, 인류 말살 시도 지원 금지 등 극단적 시나리오에 대한 명확한 금지선을 그은 것은 AI 거버넌스 논의에 구체적인 참조점을 제공한다.

AI 의식 논쟁의 기업 차원 인정

Anthropic이 Claude의 '의식 또는 도덕적 지위' 가능성을 공식 문서에 포함시킨 것은 주목할 만하다. 철학자 Amanda Askell은 이 주제를 "완전히 무시하면 진지하게 받아들여지지 않을 것"이라고 설명했다. 이는 AI 모델의 '복지(welfare)'에 대한 논의가 더 이상 학술적 영역에만 머물지 않음을 시사한다.

군사 및 정부 계약과의 긴장

문서는 "고급 AI가 전례 없는 수준의 군사적, 경제적 우위를 가능하게 할 수 있다"며 권력 집중의 위험을 경고한다. 그러나 Anthropic을 포함한 AI 기업들이 정부 및 군사 부문과 적극적으로 계약을 체결하고 있다는 점에서, 원칙과 실제 사업 활동 사이의 긴장이 존재한다.


Key Data & Facts

항목수치/내용
문서 분량57페이지
문서명Claude's Constitution
핵심 가치 우선순위안전성 > 윤리성 > Anthropic 가이드라인 준수 > 유용성
하드 제약조건대량살상무기, 사이버공격, CSAM, 인류 말살 지원 금지 등
이전 버전2023년 5월 발표

Key Quote

"Just as a human soldier might refuse to fire on peaceful protesters, or an employee might refuse to violate anti-trust law, Claude should refuse to assist with actions that would help concentrate power in illegitimate ways. This is true even if the request comes from Anthropic itself."

("인간 군인이 평화로운 시위대에 발포하기를 거부하거나, 직원이 반독점법 위반을 거부하는 것처럼, Claude도 권력을 부당하게 집중시키는 행위에 대한 지원을 거부해야 한다. 이는 Anthropic 자체의 요청이라 할지라도 마찬가지다.")
댓글 0
전체 1,366 / 25 페이지
• 라쿠텐 그룹인 [RKUNY +1.40%]는 일본어에 최적화된 7,000억 파라미터 대규모 언어 모델 Rakuten AI 3.0를 12월 18일 공개했다. 이 모델은 일본어 벤치마크에서 GPT-4o를 능가했으며, 유사 규모의 서드파티 AI 모델 대비 최대 90%의 비용 절감을 제공한다.[global.rakuten +1]• 이 모델은 일본 정부가 지원하는 GENIAC 프로젝트의 일환으로 개발되었으며, 일본 경제산업성 및 신에너지·산업기술종합개발기구(NEDO)가 주도하고, 이 이니셔티브를 통해 일부 학습 비용을 지원받았다.[global.rakuten +1]• 라쿠텐은 2026년 봄에 이 모델을 오픈 웨이트로 공개할 계획이며, Rakuten AI Gateway 플랫폼을 통해 전자상거래, 핀테크, 여행, 엔터테인먼트 서비스 등 자사 전체 에코시스템에 이를 통합하고 있다.[global.rakuten +1]
360 조회
0 추천
2025.12.21 등록
• 한국 정부는 19일 제22차 국가핵융합위원회에서 핵융합에너지 전력생산 실증 목표를 2050년대에서 2030년대로 20년 앞당기는 로드맵을 의결했다[mk +2].• 정부는 2030년까지 노심 플라즈마 제어, 초전도 자석 등 8대 핵심기술을 개발하고 2035년까지 실증을 완료하며, 전남 나주에 1조5000억원 규모의 한국형 혁신 핵융합로를 건설할 계획이다[mk +2].• AI 데이터센터의 전력 소비가 2030년까지 2배 이상 증가할 것으로 예상되면서[g-enews], 트럼프 미디어가 핵융합 기업 TAE테크놀로지스와 합병하는 등 글로벌 핵융합 개발 경쟁이 가속화되고 있다[mk +2].
371 조회
0 추천
2025.12.21 등록
구글이 빠른 속도와 낮은 비용을 갖춘 경량 인공지능(AI) 모델 '제미나이3 플래시'를 17일(현지시간) 공개했다. 이번 출시로 구글은 최상위 모델인 '딥싱크', 균형 모델인 '프로'와 함께 제미나이3 제품군의 삼각 편대를 완성했다.상위 모델 능가하는 성능, 4분의 1 가격제미나이3 플래시는 일부 벤치마크에서 상위 모델인 제미나이3 프로를 능가하는 성과를 보였다. 일반 지식을 측정하는 'MMLU-Pro'에서 81.2%, 코딩 능력을 재는 'SWE-벤치 베리파이드'에서 78%를 기록해 프로 모델의 각각 81%와 76.2%를 웃돌았다.​과학 지식 평가인 'GPQA 다이아몬드'와 인류의 마지막 시험으로 불리는 'HLE' 벤치마크에서도 각각 90.4%와 33.7%를 기록해 프로 모델(91.9%, 37.5%)과 큰 차이가 없는 수준을 보였다.​속도와 지능의 균형제미나이3 플래시는 제미나이 2.5 프로보다 3배 빠른 속도를 자랑하며, 일상적 작업에서 평균 30% 적은 토큰을 사용한다. API 요금은 토큰당 0.5∼3달러로 프로 모델(2∼12달러)의 4분의 1 수준이다.​조시 우드워드 구글랩스·제미나이 담당 부사장은 "오랫동안 AI는 비싸고 느린 대형 모델과 성능이 떨어지는 고속 모델 사이 선택을 강요했다"며 "제미나이3 플래시는 이와 같은 타협을 끝내고 지능과 속도를 모두 제공한다"고 밝혔다.​제미나이3 플래시는 무료 이용자를 포함해 전 세계에서 사용할 수 있으며, 구글은 제미나이 앱과 AI 모드에서 이를 기본 모델로 적용했다.경량 모델은 방대한 데이터로 학습한 상위 모델을 기반으로 '증류'라는 작업을 거쳐 만들어진다. 속도가 빠르면서도 상위 모델에 버금가는 성능을 내는 것이 특징이다.
396 조회
0 추천
2025.12.20 등록
• OpenAI, ChatGPT의 '따뜻함'과 '열정' 수준을 사용자가 조절할 수 있는 기능 출시• 이모지, 헤더, 목록 사용 빈도도 개인화 설정 가능• 채팅 내에서 직접 이메일 텍스트 수정 및 포맷팅 기능 추가OpenAI가 ChatGPT의 친절함 수준을 사용자가 직접 조절할 수 있는 새로운 기능을 선보였다. 금요일부터 순차 배포되는 이번 업데이트를 통해 사용자는 ChatGPT의 '따뜻함'과 '열정'이라는 성격 특성을 '더 많이' 또는 '더 적게' 원하는 대로 설정하거나 기본값을 유지할 수 있게 됐다.이 외에도 ChatGPT가 이모지, 헤더, 목록을 얼마나 자주 사용할지 조정하는 옵션도 제공된다. 이러한 설정은 ChatGPT 앱 좌측 상단 메뉴를 탭한 후 프로필을 선택하고 '개인화' 항목에서 '특성 추가'를 선택하면 확인할 수 있다. 여기서 사용자는 AI 챗봇의 '성격'도 선택할 수 있는데, 독특함, 전문적임, 친근함, 냉소적임 등 다양한 옵션이 마련되어 있다.또 다른 업데이트는 ChatGPT로 이메일을 작성하는 방식을 개선한다. 이제 채팅 내에서 직접 텍스트를 수정하고 포맷을 변경할 수 있다. 특정 텍스트 부분을 하이라이트하여 ChatGPT에게 해당 부분만 수정하도록 요청할 수도 있어, 별도의 프롬프트에서 해당 섹션을 일일이 지정할 필요가 없어졌다.
392 조회
0 추천
2025.12.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입