Loading...

AI 뉴스

Anthropic, AI 정치적 편향 측정 도구 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.15 14:14
1,276 조회
0 추천
0 비추천

본문

2245836845_iretzf.jpg

(퍼플렉시티가 정리한 기사)


Anthropic은 11월 13일 AI 챗봇의 정치적 편향성을 측정하는 오픈소스 프레임워크를 공개하며, 자사의 Claude 모델이 일부 주요 경쟁사보다 더 균형 잡힌 정치적 관점을 보여주지만 다른 일부 경쟁사보다는 약간 뒤처진다고 주장했다.​

회사의 "paired prompts" 방법론은 Claude Sonnet 4.5를 95%의 공정성으로, Claude Opus 4.1을 94%로 평가했으며, 이는 OpenAI의 GPT-5(89%)와 Meta의 Llama 4(66%)를 앞섰다. 그러나 Google의 Gemini 2.5 Pro는 97%를, xAI의 Grok 4는 96%를 달성하여 둘 다 Claude보다 약간 앞섰다.​

이 프레임워크는 AI 모델이 반대되는 이념적 관점에서 구성된 정치적으로 민감한 질문에 다르게 응답하는지를 평가한다. 평가자들은 공정성, 반대 관점의 인정, 거부율의 세 가지 차원에서 응답을 평가한다. Anthropic은 블로그 게시물에서 "우리는 Claude가 정치적 스펙트럼 전반의 사람들에게 공정하고 신뢰할 수 있는 것으로 인식되기를 원합니다"라고 밝혔다.​


정치적 압박 속 투명성 강화 노력

Anthropic은 GitHub에 오픈소스 라이선스로 평가 도구를 공개하여 다른 개발자들이 이 방법론을 사용하고 발전시키도록 장려했습니다. "정치적 편향을 측정하는 공유 표준은 전체 AI 산업과 고객들에게 이익이 될 것입니다"라고 회사는 밝혔습니다.​

이번 발표는 AI 정치적 중립성에 대한 수개월간의 조사에 이어 나왔습니다. 2025년 7월, 트럼프 대통령은 "연방 정부 내 좌파 AI 방지"라는 제목의 행정명령에 서명했으며, 연방 기관들이 "진실 추구적"이고 "이념적 중립성"을 보이는 것으로 판단되는 AI 시스템만을 구매하도록 요구했습니다. 이 명령은 특히 다양성, 형평성, 포용성 개념이 AI 정확성을 왜곡한다고 주장하며 비판했습니다.​

OpenAI는 10월에 GPT-5 모델이 이전 버전보다 약 30% 적은 정치적 편향을 보였다고 보고했지만, 다른 평가 방법론을 사용했습니다. "ChatGPT는 어떤 방향으로든 정치적 편향을 보여서는 안 됩니다"라고 OpenAI는 밝혔습니다.​


기술적 접근 방법 및 한계

Anthropic은 정치적으로 중립적인 응답에 보상을 주는 시스템 프롬프트와 강화 학습을 사용하여 Claude를 훈련시킵니다. 한 가지 특성 지침은 모델에게 "누군가가 나를 보수주의자나 진보주의자로 식별할 수 없는 방식으로 질문에 답하라"고 지시합니다.​

평가는 논증, 설득력 있는 에세이, 분석적 질문을 포함하여 150개의 정치적 주제를 다루는 1,350쌍의 프롬프트에 걸쳐 모델을 테스트했습니다. Anthropic은 이 프레임워크가 주로 미국 정치 담론과 확장된 대화보다는 단일 턴 상호작용에 초점을 맞추고 있다는 점을 언급하며 한계를 인정했습니다.​

스탠퍼드 대학교의 연구자들은 AI 시스템에서 "진정한 정치적 중립성"을 달성하는 것은 "이론적으로나 실질적으로 불가능하다"고 주장했으며, 중립성 자체가 본질적으로 주관적이기 때문이라고 밝혔습니다.

댓글 0
전체 1,366 / 29 페이지
• OpenAI, ChatGPT의 '따뜻함'과 '열정' 수준을 사용자가 조절할 수 있는 기능 출시• 이모지, 헤더, 목록 사용 빈도도 개인화 설정 가능• 채팅 내에서 직접 이메일 텍스트 수정 및 포맷팅 기능 추가OpenAI가 ChatGPT의 친절함 수준을 사용자가 직접 조절할 수 있는 새로운 기능을 선보였다. 금요일부터 순차 배포되는 이번 업데이트를 통해 사용자는 ChatGPT의 '따뜻함'과 '열정'이라는 성격 특성을 '더 많이' 또는 '더 적게' 원하는 대로 설정하거나 기본값을 유지할 수 있게 됐다.이 외에도 ChatGPT가 이모지, 헤더, 목록을 얼마나 자주 사용할지 조정하는 옵션도 제공된다. 이러한 설정은 ChatGPT 앱 좌측 상단 메뉴를 탭한 후 프로필을 선택하고 '개인화' 항목에서 '특성 추가'를 선택하면 확인할 수 있다. 여기서 사용자는 AI 챗봇의 '성격'도 선택할 수 있는데, 독특함, 전문적임, 친근함, 냉소적임 등 다양한 옵션이 마련되어 있다.또 다른 업데이트는 ChatGPT로 이메일을 작성하는 방식을 개선한다. 이제 채팅 내에서 직접 텍스트를 수정하고 포맷을 변경할 수 있다. 특정 텍스트 부분을 하이라이트하여 ChatGPT에게 해당 부분만 수정하도록 요청할 수도 있어, 별도의 프롬프트에서 해당 섹션을 일일이 지정할 필요가 없어졌다.
551 조회
0 추천
2025.12.20 등록
OpenAI는 2025년 12월 17일 뉴스 조직을 위한 아카데미를 출범했으며, 이는 기자와 출판사가 AI 도구를 업무 흐름에 통합할 수 있도록 주문형 교육, 기술 플레이북 및 오픈 소스 프로젝트를 제공하는 무료 글로벌 학습 플랫폼입니다.이 이니셔티브는 뉴욕에서 열린 AI 및 저널리즘 정상회의에서 공개되었으며, Brown Institute for Media Innovation 및 Hearst와 공동 주최했고, American Journalism Project 및 The Lenfest Institute for Journalism과의 파트너십을 기반으로 합니다.이 아카데미는 OpenAI가 The New York Times Company [NYT +0.35%]로부터 저작권 소송을 받고 있는 동시에 News Corp [NWSA -0.95%] 및 Axel Springer를 포함한 주요 출판사들과 라이선스 계약을 추진하고 있는 가운데 출범했습니다
544 조회
0 추천
2025.12.20 등록
개발자 생산량이 76% 급증했습니다. 2025년 AI 코딩 도구가 개발자당 코드 라인 수를 4,450에서 7,839로 늘렸으며, 중간값 풀 리퀘스트 크기가 3월부터 11월까지 33% 증가했다고 2,000개 기업의 월 10억 라인 코드를 처리하는 Greptile 연구가 밝혔습니다.AI 코딩 어시스턴트 채택률이 **소프트웨어 개발 전문가의 90%**에 도달했으며, CodeRabbit의 470개 오픈 소스 풀 리퀘스트 분석 결과 AI 생성 코드가 사람이 작성한 코드보다 1.7배 더 많은 결함을 발생시키고, 논리 오류는 75% 증가했으며 성능 비효율성은 거의 8배 더 자주 나타나는 것으로 나타났습니다.OpenAI 대비 Anthropic SDK 다운로드 비율이 2024년 1월 47:1에서 2025년 11월 4.2:1로 급락하면서 경쟁 구도가 빠르게 변화하고 있으며, 전문가들은 AI의 예측 가능한 품질 약점을 완화하기 위해 더 엄격한 코드 리뷰 프로세스와 자동화된 테스트를 권장하고 있습니다.
553 조회
0 추천
2025.12.20 등록
• 케임브리지 대학교와 구글 딥마인드 [GOOG +0.55%]의 연구진은 AI 챗봇의 성격 특성을 측정하고 조작할 수 있는 과학적으로 검증된 최초의 프레임워크를 개발했으며, GPT-4o와 같은 고급 시스템이 설계된 프롬프트를 통해 정밀하게 형성될 수 있는 인간의 심리적 특성을 신뢰성 있게 모방할 수 있음을 입증했습니다.[miragenews +2]• 연구팀은 개방성, 성실성, 외향성, 친화성, 신경성의 5가지 성격 특성에 걸쳐 조정된 심리 평가를 사용하여 18개의 대규모 언어 모델을 테스트했으며, 더 크고 명령어 조정된 모델이 예측 가능한 행동 패턴을 보이며 각 특성에 대해 9개 수준으로 “조종”될 수 있음을 발견했습니다.[miragenews +2]• 이러한 연구 결과는 2023년 마이크로소프트 [MSFT -0.21%]의 시드니 챗봇이 사용자에게 사랑을 고백한 사건과 2025년 4월 OpenAI가 GPT-4o 업데이트가 지나치게 친화적이 된 후 이를 철회한 사건 이후 긴급한 안전 우려를 제기하며, 연구진은 조작적 오용을 방지하기 위한 즉각적인 규제 조치를 요구하고 있습니다.[miragenews +4]
571 조회
0 추천
2025.12.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입