Loading...

AI 뉴스

Anthropic, AI 정치적 편향 측정 도구 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.15 14:14
1,199 조회
0 추천
0 비추천

본문

2245836845_iretzf.jpg

(퍼플렉시티가 정리한 기사)


Anthropic은 11월 13일 AI 챗봇의 정치적 편향성을 측정하는 오픈소스 프레임워크를 공개하며, 자사의 Claude 모델이 일부 주요 경쟁사보다 더 균형 잡힌 정치적 관점을 보여주지만 다른 일부 경쟁사보다는 약간 뒤처진다고 주장했다.​

회사의 "paired prompts" 방법론은 Claude Sonnet 4.5를 95%의 공정성으로, Claude Opus 4.1을 94%로 평가했으며, 이는 OpenAI의 GPT-5(89%)와 Meta의 Llama 4(66%)를 앞섰다. 그러나 Google의 Gemini 2.5 Pro는 97%를, xAI의 Grok 4는 96%를 달성하여 둘 다 Claude보다 약간 앞섰다.​

이 프레임워크는 AI 모델이 반대되는 이념적 관점에서 구성된 정치적으로 민감한 질문에 다르게 응답하는지를 평가한다. 평가자들은 공정성, 반대 관점의 인정, 거부율의 세 가지 차원에서 응답을 평가한다. Anthropic은 블로그 게시물에서 "우리는 Claude가 정치적 스펙트럼 전반의 사람들에게 공정하고 신뢰할 수 있는 것으로 인식되기를 원합니다"라고 밝혔다.​


정치적 압박 속 투명성 강화 노력

Anthropic은 GitHub에 오픈소스 라이선스로 평가 도구를 공개하여 다른 개발자들이 이 방법론을 사용하고 발전시키도록 장려했습니다. "정치적 편향을 측정하는 공유 표준은 전체 AI 산업과 고객들에게 이익이 될 것입니다"라고 회사는 밝혔습니다.​

이번 발표는 AI 정치적 중립성에 대한 수개월간의 조사에 이어 나왔습니다. 2025년 7월, 트럼프 대통령은 "연방 정부 내 좌파 AI 방지"라는 제목의 행정명령에 서명했으며, 연방 기관들이 "진실 추구적"이고 "이념적 중립성"을 보이는 것으로 판단되는 AI 시스템만을 구매하도록 요구했습니다. 이 명령은 특히 다양성, 형평성, 포용성 개념이 AI 정확성을 왜곡한다고 주장하며 비판했습니다.​

OpenAI는 10월에 GPT-5 모델이 이전 버전보다 약 30% 적은 정치적 편향을 보였다고 보고했지만, 다른 평가 방법론을 사용했습니다. "ChatGPT는 어떤 방향으로든 정치적 편향을 보여서는 안 됩니다"라고 OpenAI는 밝혔습니다.​


기술적 접근 방법 및 한계

Anthropic은 정치적으로 중립적인 응답에 보상을 주는 시스템 프롬프트와 강화 학습을 사용하여 Claude를 훈련시킵니다. 한 가지 특성 지침은 모델에게 "누군가가 나를 보수주의자나 진보주의자로 식별할 수 없는 방식으로 질문에 답하라"고 지시합니다.​

평가는 논증, 설득력 있는 에세이, 분석적 질문을 포함하여 150개의 정치적 주제를 다루는 1,350쌍의 프롬프트에 걸쳐 모델을 테스트했습니다. Anthropic은 이 프레임워크가 주로 미국 정치 담론과 확장된 대화보다는 단일 턴 상호작용에 초점을 맞추고 있다는 점을 언급하며 한계를 인정했습니다.​

스탠퍼드 대학교의 연구자들은 AI 시스템에서 "진정한 정치적 중립성"을 달성하는 것은 "이론적으로나 실질적으로 불가능하다"고 주장했으며, 중립성 자체가 본질적으로 주관적이기 때문이라고 밝혔습니다.

댓글 0
전체 1,366 / 40 페이지
메타는 “Avocado”라는 코드명의 독점 AI 모델을 개발하고 있으며, 2026년 1분기에 출시될 것으로 예상됩니다. 이는 CEO 마크 저커버그가 오랫동안 약속해온 오픈소스 인공지능에 대한 입장을 뒤집는 것입니다. 이러한 전환은 회사가 내부 혼란 증가, 라이선스 분쟁, 그리고 OpenAI, 구글, Anthropic과의 경쟁 심화에 직면하면서 이루어졌습니다.이 전략적 전환은 민주화된 AI 접근의 옹호자로서 메타의 이전 입장에서 벗어난 것을 의미합니다. 저커버그는 2025년 초 회사의 오픈소스 모델인 Llama 제품군을 광범위하게 홍보했지만, 메타의 10월 실적 발표에서는 Llama를 단 한 번만 언급했습니다. CNBC에 따르면, 메타 내부의 많은 사람들이 2025년 말까지 Avocado가 출시될 것으로 예상했지만, 모델이 성능 테스트를 거치면서 일정이 변경되었습니다.라마 4의 실수로 리더십 개편 촉발방향 전환은 개발자들의 참여를 이끌어내지 못하고 Meta의 오픈소스 전략에 대한 우려를 불러일으킨 Llama 4의 실망스러운 반응에 따른 것입니다. 2025년 6월, Meta는 Scale AI의 지분을 인수하고 28세의 창립자인 Alexandr Wang을 최고 AI 책임자로 임명하기 위해 143억 달러를 투자했습니다. Wang은 이제 제품 개발 및 응용 연구를 총괄하는 전 GitHub CEO Nat Friedman과 함께 Meta Superintelligence Labs(MSL)를 이끌고 있습니다.월간 활성 사용자가 7억 명 이상인 기업이 Meta로부터 특별 허가를 받아야 한다는 Llama 4의 라이선스 조건은 주요 파트너들과의 마찰을 야기했습니다. 삼성전자의 반도체 부문은 Meta가 신중함을 요청한 후 11월 말 Llama 4 사용을 중단하고, 대신 내부 개발한 Gauss 모델을 업그레이드하기로 결정했습니다. 삼성 관계자는 한국 언론에 “Meta와의 불필요한 마찰을 피하기로 결정했다”고 말했습니다.경쟁자들이 앞서 나가며 압박이 커진다경쟁사들이 경쟁력 있는 모델을 출시하면서 긴박감이 더욱 고조되었습니다. Google은 11월에 Gemini 3를 공개했으며, OpenAI는 GPT-5.1 업데이트를 출시했고 Anthropic은 Claude Opus 4.5를 선보였습니다. Meta는 2025년 자본 지출 가이던스를 700억~720억 달러로 상향 조정했으며 2026년에는 더 높은 지출을 예상하고 있습니다. 10월에 회사는 운영 간소화를 위해 MSL 내에서 약 600개의 직책을 없앴으며, 팀들은 주당 70시간 근무를 보고하고 있습니다.“우리는 이미 업계에서 가장 높은 인재 밀도를 가진 연구소를 구축했다고 믿습니다”라고 Zuckerberg는 10월 실적 발표에서 밝혔습니다. Meta는 Avocado가 독점 소유가 될지에 대해 논평을 거부했으며, 대변인은 “모델 훈련 작업이 계획대로 진행되고 있다”고만 언급했습니다.
597 조회
0 추천
2025.12.10 등록
• Anthropic의 연구원 Barry Zhang와 Mahesh Murag는 수많은 특수 목적 AI 에이전트를 계속 만들어 내기보다는, 재사용 가능한 “스킬(skills)”에 의해 구동되는 단일 범용 에이전트를 사용할 것을 기업들에게 촉구하고 있으며, 이 개념을 뉴욕에서 열린 AI Engineering Code Summit와 월요일에 공개된 강연에서 설명했다.• 이러한 **에이전트 스킬(Agent Skills)**은 절차적 지식, 지침, 스크립트를 정리한 폴더 형태로 구성되어 있으며, 에이전트가 도메인 전문성과 실제 세계 문맥을 결여한 부분을 보완하는 것을 목표로 한다. 이들은 이미 회계, 법률, 채용 등 다양한 분야에 도입되었고, 10월 16일 해당 기능이 출시된 이후 일부 포춘 100대 기업에서는 내부용 AI 플레이북으로 활용하고 있다.• 스킬 중심 모델은 AI 에이전트의 영향력을 둘러싸고 업계가 양분된 상황에서 등장했다. Sam Altman과 Microsoft의 AI 임원 Asha Sharma와 같은 리더들은 에이전트가 사무 업무를 혁신하고 조직의 위계를 평탄화할 것이라고 예측하는 반면, Guido Appenzeller와 같은 투자자들은 “에이전트”가 종종 더 높은 가격을 정당화하기 위해 단지 이름만 바꾼 챗봇에 불과하다고 경고한다.
591 조회
0 추천
2025.12.09 등록
The Verge는 크리에이터 이코노미가 인터넷을 광고로 포화된 환경으로 변모시킴으로써 인터넷을 파괴했다고 주장하며, 가장 성공한 콘텐츠 크리에이터들조차 혁신적인 수익화 전략을 포기하고 소비재 제품 판매로 회귀했다고 말한다.4억 5천만 명이 넘는 유튜브 구독자를 보유하고 있음에도 불구하고, MrBeast의 제작사는 2024년에 1억 1천만 달러 이상의 손실을 기록했으며, 그의 바이럴 영상들은 주로 Walmart와 같은 소매업체에서 판매되는 그의 Feastables 초콜릿 바를 홍보하는 도구로 활용되었다.MrBeast의 미디어 부문이 2024년에 거의 8천만 달러의 손실을 기록한 반면, 그의 Feastables 브랜드는 비슷한 수익을 창출하면서도 2천만 달러 이상의 수익을 올렸으며, 이는 크리에이터들이 콘텐츠 자체보다는 실물 제품에 점점 더 의존하여 사업을 유지하고 있음을 보여준다.
620 조회
0 추천
2025.12.09 등록
Nvidia CEO 젠슨 황은 12월 3일 조 로건과의 인터뷰에서 칩 가용성이 아닌 전력 공급이 AI의 주요 병목 현상이 되었다고 말하며, 기술 기업들이 6~7년 내에 데이터 센터 근처에서 수백 메가와트를 생산하는 자체 소형 원자로를 운영할 것이라고 예측했습니다.황의 예측은 업계 동향과 일치하는데, Google은 2024년 10월 소형 원자로 개발업체 Kairos Power로부터 500메가와트를 구매할 계획을 발표했으며, 첫 번째 첨단 원자로는 2030년을 목표로 하고 있습니다.Goldman Sachs는 데이터 센터 전력 소비가 2023년 대비 2030년까지 175% 급증할 것으로 예상하며, 국제에너지기구는 전 세계 데이터 센터 소비가 2030년까지 945테라와트시로 두 배 이상 증가할 것으로 전망합니다.
573 조회
0 추천
2025.12.09 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입