Loading...

AI 뉴스

Anthropic, AI 정치적 편향 측정 도구 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.15 14:14
1,372 조회
0 추천
0 비추천

본문

2245836845_iretzf.jpg

(퍼플렉시티가 정리한 기사)


Anthropic은 11월 13일 AI 챗봇의 정치적 편향성을 측정하는 오픈소스 프레임워크를 공개하며, 자사의 Claude 모델이 일부 주요 경쟁사보다 더 균형 잡힌 정치적 관점을 보여주지만 다른 일부 경쟁사보다는 약간 뒤처진다고 주장했다.​

회사의 "paired prompts" 방법론은 Claude Sonnet 4.5를 95%의 공정성으로, Claude Opus 4.1을 94%로 평가했으며, 이는 OpenAI의 GPT-5(89%)와 Meta의 Llama 4(66%)를 앞섰다. 그러나 Google의 Gemini 2.5 Pro는 97%를, xAI의 Grok 4는 96%를 달성하여 둘 다 Claude보다 약간 앞섰다.​

이 프레임워크는 AI 모델이 반대되는 이념적 관점에서 구성된 정치적으로 민감한 질문에 다르게 응답하는지를 평가한다. 평가자들은 공정성, 반대 관점의 인정, 거부율의 세 가지 차원에서 응답을 평가한다. Anthropic은 블로그 게시물에서 "우리는 Claude가 정치적 스펙트럼 전반의 사람들에게 공정하고 신뢰할 수 있는 것으로 인식되기를 원합니다"라고 밝혔다.​


정치적 압박 속 투명성 강화 노력

Anthropic은 GitHub에 오픈소스 라이선스로 평가 도구를 공개하여 다른 개발자들이 이 방법론을 사용하고 발전시키도록 장려했습니다. "정치적 편향을 측정하는 공유 표준은 전체 AI 산업과 고객들에게 이익이 될 것입니다"라고 회사는 밝혔습니다.​

이번 발표는 AI 정치적 중립성에 대한 수개월간의 조사에 이어 나왔습니다. 2025년 7월, 트럼프 대통령은 "연방 정부 내 좌파 AI 방지"라는 제목의 행정명령에 서명했으며, 연방 기관들이 "진실 추구적"이고 "이념적 중립성"을 보이는 것으로 판단되는 AI 시스템만을 구매하도록 요구했습니다. 이 명령은 특히 다양성, 형평성, 포용성 개념이 AI 정확성을 왜곡한다고 주장하며 비판했습니다.​

OpenAI는 10월에 GPT-5 모델이 이전 버전보다 약 30% 적은 정치적 편향을 보였다고 보고했지만, 다른 평가 방법론을 사용했습니다. "ChatGPT는 어떤 방향으로든 정치적 편향을 보여서는 안 됩니다"라고 OpenAI는 밝혔습니다.​


기술적 접근 방법 및 한계

Anthropic은 정치적으로 중립적인 응답에 보상을 주는 시스템 프롬프트와 강화 학습을 사용하여 Claude를 훈련시킵니다. 한 가지 특성 지침은 모델에게 "누군가가 나를 보수주의자나 진보주의자로 식별할 수 없는 방식으로 질문에 답하라"고 지시합니다.​

평가는 논증, 설득력 있는 에세이, 분석적 질문을 포함하여 150개의 정치적 주제를 다루는 1,350쌍의 프롬프트에 걸쳐 모델을 테스트했습니다. Anthropic은 이 프레임워크가 주로 미국 정치 담론과 확장된 대화보다는 단일 턴 상호작용에 초점을 맞추고 있다는 점을 언급하며 한계를 인정했습니다.​

스탠퍼드 대학교의 연구자들은 AI 시스템에서 "진정한 정치적 중립성"을 달성하는 것은 "이론적으로나 실질적으로 불가능하다"고 주장했으며, 중립성 자체가 본질적으로 주관적이기 때문이라고 밝혔습니다.

댓글 0
전체 1,366 / 19 페이지
구글은생성AI가단순히텍스트답변을내놓는것을넘어,대화맥락에맞는사용자인터페이스(UI)를직접생성할수있도록돕는오픈소스프로토콜'A2UI'를출시했습니다.기존에는AI가HTML코드등을보내UI를구현하려했으나,보안위험과앱디자인과의부조화문제가있었습니다.A2UI는UI구성요소를'데이터(JSON)'형태로전달하여각앱의프레임워크에맞춰안전하고자연스럽게렌더링하도록설계되었습니다.이프로토콜의가장큰특징은보안성과유연성입니다.실행가능한코드가아닌사전에약속된컴포넌트정보만주고받기때문에임의스크립트실행과같은보안공격을방지할수있습니다.또한앵귤러,플러터,리액트등다양한개발환경에서재사용이가능하며,AI가계산을수행하는동안UI가실시간으로구성되는스트리밍방식의점진적렌더링을지원해사용자경험을크게향상시킵니다.A2UI는여러기업의AI에이전트들이협업하는'멀티에이전트'환경에서복잡한작업을효율적으로처리하기위해개발되었습니다.예를들어레스토랑예약처럼텍스트로만대화하기번거로운상황에서AI가즉시예약폼이나버튼을생성해사용자에게보여줌으로써작업속도를높여줍니다.구글은이표준기술을통해서로다른시스템의AI들이안전하고일관된방식으로사용자와소통할수있는기반을마련할계획입니다.
516 조회
0 추천
2025.12.28 등록
미국이인공지능(AI)패권전쟁에서초기승기를잡았음에도불구하고,화석연료중심의에너지정책때문에결국중국에역전당할수있다는경고가나왔습니다.트럼프행정부는생산성회복을위해AI발전을강조하고있지만,재생에너지를확대하는중국과달리화석연료의존도를높이고있어장기적인비용경쟁력에서뒤처질위험에처해있습니다.중국은태양광과해상풍력등재생에너지를빠르게늘리며AI전력비용을낮추고있는반면,미국은2030년대까지데이터센터전력의상당부분을천연가스등비싼화석연료에의존할전망입니다.에너지비용곡선이하락하는재생에너지와달리화석연료는비용압박이커질수밖에없어,저렴한에너지를확보한중국AI산업이가격경쟁력에서유리한고지를점할것으로분석됩니다.또한,화석연료발전과데이터센터운영에필요한막대한용수공급문제도미국AI산업의발목을잡는요인으로지적되었습니다.현재미국신규데이터센터의상당수가물부족지역에위치해있어,향후물부족심화와식량안보위기가사회적비용상승으로이어져AI발전을가로막는경제적부담이될수있다는진단입니다.
516 조회
0 추천
2025.12.28 등록
많은기업이인건비를줄이기위해인공지능(AI)도입을서두르고있지만,직원의역할을지나치게단순화해판단하는'도어맨의오류'에빠져오히려비용이증가하는부작용을겪고있습니다.이는겉으로드러난핵심업무만자동화하면인간을완전히대체할수있다는잘못된믿음에서비롯됩니다.실제로AI상담원을도입했던금융권이나패스트푸드체인등에서고객불만이폭증하고서비스품질이저하되는사례가잇따르고있습니다.인간직원이제공하던섬세한응대나맥락이해같은'보이지않는가치'가사라지면서,결국해고했던직원을복귀시키거나서비스를재검토하는등추가비용을지불하게된것입니다.전문가들은AI가인간을완전히대체하기보다인간의판단력과결합될때가장큰효과를낼수있다고강조합니다.효율성만을기준으로기술을도입하기에앞서,해당직무가실제현장에서어떤복합적인가치를창출하는지깊이이해하는능력이기업경영의핵심과제로떠오르고있습니다.
515 조회
0 추천
2025.12.28 등록
어원학자AdamAleksic은TED강연에서알고리즘과AI는중립적인도구가아니라수익중심플랫폼의이익을위해현실을적극적으로왜곡하며,사람들이인식하지못하는방식으로언어,문화적트렌드,정체성을무의식적으로재구성한다고주장한다.360,000개이상의YouTube동영상과771,000개의팟캐스트에피소드를분석한연구에따르면,ChatGPT가자주사용하는단어들—챗봇이나이지리아훈련작업자들로부터습득했을가능성이있는“delve”를포함하여—이해당도구의출시이후자발적인구어대화에서크게증가한것으로나타났다.Spotify는자사알고리즘에서유사한청취자들의신흥클러스터를식별하고“hyperpop”재생목록을만들었으며,이는미학적방향을제시하고음악가들이hyperpop음악을만들도록촉진했다.이는플랫폼이알고리즘적현실표현이현실그자체가되는자기강화피드백루프를어떻게만드는지를보여준다.
516 조회
0 추천
2025.12.28 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입