Loading...

AI 뉴스

Anthropic, AI 정치적 편향 측정 도구 출시

페이지 정보

작성자 xtalfi
작성일 11.15 14:14
13 조회
0 추천
0 비추천

본문

2245836845_iretzf.jpg

(퍼플렉시티가 정리한 기사)


Anthropic은 11월 13일 AI 챗봇의 정치적 편향성을 측정하는 오픈소스 프레임워크를 공개하며, 자사의 Claude 모델이 일부 주요 경쟁사보다 더 균형 잡힌 정치적 관점을 보여주지만 다른 일부 경쟁사보다는 약간 뒤처진다고 주장했다.​

회사의 "paired prompts" 방법론은 Claude Sonnet 4.5를 95%의 공정성으로, Claude Opus 4.1을 94%로 평가했으며, 이는 OpenAI의 GPT-5(89%)와 Meta의 Llama 4(66%)를 앞섰다. 그러나 Google의 Gemini 2.5 Pro는 97%를, xAI의 Grok 4는 96%를 달성하여 둘 다 Claude보다 약간 앞섰다.​

이 프레임워크는 AI 모델이 반대되는 이념적 관점에서 구성된 정치적으로 민감한 질문에 다르게 응답하는지를 평가한다. 평가자들은 공정성, 반대 관점의 인정, 거부율의 세 가지 차원에서 응답을 평가한다. Anthropic은 블로그 게시물에서 "우리는 Claude가 정치적 스펙트럼 전반의 사람들에게 공정하고 신뢰할 수 있는 것으로 인식되기를 원합니다"라고 밝혔다.​


정치적 압박 속 투명성 강화 노력

Anthropic은 GitHub에 오픈소스 라이선스로 평가 도구를 공개하여 다른 개발자들이 이 방법론을 사용하고 발전시키도록 장려했습니다. "정치적 편향을 측정하는 공유 표준은 전체 AI 산업과 고객들에게 이익이 될 것입니다"라고 회사는 밝혔습니다.​

이번 발표는 AI 정치적 중립성에 대한 수개월간의 조사에 이어 나왔습니다. 2025년 7월, 트럼프 대통령은 "연방 정부 내 좌파 AI 방지"라는 제목의 행정명령에 서명했으며, 연방 기관들이 "진실 추구적"이고 "이념적 중립성"을 보이는 것으로 판단되는 AI 시스템만을 구매하도록 요구했습니다. 이 명령은 특히 다양성, 형평성, 포용성 개념이 AI 정확성을 왜곡한다고 주장하며 비판했습니다.​

OpenAI는 10월에 GPT-5 모델이 이전 버전보다 약 30% 적은 정치적 편향을 보였다고 보고했지만, 다른 평가 방법론을 사용했습니다. "ChatGPT는 어떤 방향으로든 정치적 편향을 보여서는 안 됩니다"라고 OpenAI는 밝혔습니다.​


기술적 접근 방법 및 한계

Anthropic은 정치적으로 중립적인 응답에 보상을 주는 시스템 프롬프트와 강화 학습을 사용하여 Claude를 훈련시킵니다. 한 가지 특성 지침은 모델에게 "누군가가 나를 보수주의자나 진보주의자로 식별할 수 없는 방식으로 질문에 답하라"고 지시합니다.​

평가는 논증, 설득력 있는 에세이, 분석적 질문을 포함하여 150개의 정치적 주제를 다루는 1,350쌍의 프롬프트에 걸쳐 모델을 테스트했습니다. Anthropic은 이 프레임워크가 주로 미국 정치 담론과 확장된 대화보다는 단일 턴 상호작용에 초점을 맞추고 있다는 점을 언급하며 한계를 인정했습니다.​

스탠퍼드 대학교의 연구자들은 AI 시스템에서 "진정한 정치적 중립성"을 달성하는 것은 "이론적으로나 실질적으로 불가능하다"고 주장했으며, 중립성 자체가 본질적으로 주관적이기 때문이라고 밝혔습니다.

댓글 0
전체 1,021 / 21 페이지
(퍼플렉시티가정리한기사)런던은영국스타트업Wayve가이번달도시의까다로운거리에서레벨4로보택시테스트를시작하면서첫번째자율주행차시범운행을시작했으며,이는영국을자율주행차배치를위한글로벌경쟁에서경쟁자로자리매김하게했습니다.이번시범운행은영국정부의신속추진파일럿프로그램에따라2026년상용출시계획에앞서진행됩니다.​Wayve의FordMustangMach-E테스트차량은현재사전매핑된경로에의존하기보다는인간처럼운전을학습하는엔드투엔드신경망을사용하여북런던의좁고구불구불한거리를주행하고있습니다.Waymo와같이상세한지도와광범위한센서배열을사용하는경쟁업체와달리,Wayve의접근방식은앞유리위의작은센서박스만있으면되는적은하드웨어만필요로합니다.​자율성에대한다른접근법Wayve의기술은전통적인자율주행방식에서벗어난것을의미합니다.이회사의"AV2.0"시스템은경험을통해학습하고새로운환경에적응하는EmbodiedAI를사용하며,이는인간운전자가시간이지남에따라기술을습득하는방식과유사합니다.Wayve의CEO이자공동창립자인AlexKendall은"우리의EmbodiedAI는어디서든,어떤차량에서든운전을학습합니다"라고말했습니다.​이접근방식은최근시험주행에서그능력을입증했으며,무단횡단자부터주차된차량사이로걸어나오는시각장애보행자까지런던의악명높은예측불가능성을처리했습니다.그러나차량들은자전거이용자들뒤에서천천히따라가고교차로에서일반적인런던운전자들보다더오래정지하는등신중한행동을보였습니다.​2026년출시경쟁이번시험운행은Wayve와Waymo간의직접적인경쟁구도를형성하며,두회사모두2026년런던출시를목표로하고있습니다.Waymo는10월에무인차량호출서비스를영국수도에도입할계획을발표했으며,이는유럽최초의확장을의미합니다.이서비스는차량파트너Moove가관리하는완전전기JaguarI-Pace차량을사용할예정입니다.​한편Wayve는와파트너십을맺고2026년봄까지자율주행차량을상업적으로배치할계획입니다.영국정부의자율주행시범운행가속화프레임워크와함께6월에발표된이파트너십은영국을Uber의자율주행차량시험운행을위한최대시장으로만듭니다.HeidiAlexander교통부장관은이사업이2035년까지38,000개의일자리를창출하고경제에420억파운드를추가할수있다고밝혔습니다.​Wayve는,Microsoft,를포함한투자자들로부터10억달러이상을유치했으며,회사가치를80억달러로평가할수있는추가자금조달논의에대한보도도있었습니다.
12 조회
0 추천
11.15 등록
(퍼플렉시티가정리한기사)인공지능이맹렬한속도로발전함에따라,오래된철학적질문이새롭게주목받고있습니다:우리는컴퓨터시뮬레이션속에살고있는것일까요?최근AI세계구축기술의발전은시뮬레이션이론에새로운생명을불어넣는동시에고대종교교리와의놀라운유사점에대한대화를촉발시켰습니다.이번주애리조나주립대학교연구원이자MIT출신컴퓨터과학자인리즈완버크(RizwanVirk)의기사를통해논의가더욱가열되었습니다.이기사는시뮬레이션이론이수천년동안신비주의자들이숙고해온개념들과어떻게공명하는지를탐구합니다.버크는자신의2025년저서에대해쓰면서,현대AI도구들이이제광대한가상세계를창조한다는아이디어를"더이상그러한환상으로여겨지지않게"만들었다고주장합니다.​AI는불가능을가능하게만든다Google의2025년8월Genie3출시는이러한변화를잘보여줍니다.DeepMind월드모델은간단한텍스트프롬프트로부터720p해상도의상호작용가능한3D환경을생성하며,수분동안물리적일관성을유지합니다.이를2025년최고의발명품중하나로선정한TIME매거진에따르면,사용자들은이제"고대로마탐험을시뮬레이션"하거나"실제생활에서테스트하기에는너무위험한"시나리오에서AI에이전트를훈련시킬수있습니다.​철학자닉보스트롬의2003년논문으로대중화된시뮬레이션가설은,만약고도로발달한문명이의식을가진시뮬레이션을만들수있다면,우리자신도시뮬레이션속에살고있을가능성이높다고제안합니다.컬럼비아대학교의천문학자데이비드키핑은2020년에그확률을대략50대50으로계산했습니다.그러나브리티시컬럼비아대학교의최근연구는이를완전히반박합니다.10월말JournalofHolographyApplicationsinPhysics에발표된연구에서,미르파이잘박사가이끄는연구팀은괴델의불완전성정리를사용하여우주가시뮬레이션일수없음을수학적으로증명했습니다.파이잘은"모든시뮬레이션은본질적으로알고리즘적"이지만,현실은계산될수없는"비알고리즘적이해"를필요로한다고설명했습니다.​고대의지혜가현대기술을만나다버크의분석은시뮬레이션이론이여러전통에서의종교적개념을어떻게반영하는지보여준다.힌두교와불교의가르침에서는세상을‘마야’,즉환상으로설명하며—이는꿈에서깨어날수있다는관점과유사하다.오늘날게임에서흔히쓰이는아바타라는개념역시신성한존재가인간의형태로현신하는것을서술한산스크리트경전에서유래했다.심지어영혼과신체의관계도비슷한점이있다.만약의식이플레이어이고,신체가게임속캐릭터에불과하다면,종교에서말하는환생은가상세계에서여러라운드를플레이하는것과유사하다.​트랜스휴머니스트철학자데이비드피어스는보스트롬의논증을“2000년만에나온창조주의존재에대한첫흥미로운논증”이라고불렀으며,종교적창조서사와시뮬레이션이론이모두신의말씀또는컴퓨터코드와같은명령으로세상을창조한다는점을지적했다.​Genie3같은AI도구와하셈알-가일리의“프롬프트이론”단편영상등바이럴창작물들이현실과시뮬레이션의경계를모호하게만들면서,현실의본질에관한오래된질문은그어느때보다도절실하게다가오고있다.수학적으로불가능하다고하든,철학적으로깊이가있다고하든,시뮬레이션이론은최첨단기술과인간의영원한경탄사이의다리를계속해서놓아가고있다.
14 조회
0 추천
11.15 등록
(퍼플렉시티가정리한기사)Anthropic은11월13일AI챗봇의정치적편향성을측정하는오픈소스프레임워크를공개하며,자사의Claude모델이일부주요경쟁사보다더균형잡힌정치적관점을보여주지만다른일부경쟁사보다는약간뒤처진다고주장했다.​회사의"pairedprompts"방법론은ClaudeSonnet4.5를95%의공정성으로,ClaudeOpus4.1을94%로평가했으며,이는OpenAI의GPT-5(89%)와Meta의Llama4(66%)를앞섰다.그러나Google의Gemini2.5Pro는97%를,xAI의Grok4는96%를달성하여둘다Claude보다약간앞섰다.​이프레임워크는AI모델이반대되는이념적관점에서구성된정치적으로민감한질문에다르게응답하는지를평가한다.평가자들은공정성,반대관점의인정,거부율의세가지차원에서응답을평가한다.Anthropic은블로그게시물에서"우리는Claude가정치적스펙트럼전반의사람들에게공정하고신뢰할수있는것으로인식되기를원합니다"라고밝혔다.​정치적압박속투명성강화노력Anthropic은GitHub에오픈소스라이선스로평가도구를공개하여다른개발자들이이방법론을사용하고발전시키도록장려했습니다."정치적편향을측정하는공유표준은전체AI산업과고객들에게이익이될것입니다"라고회사는밝혔습니다.​이번발표는AI정치적중립성에대한수개월간의조사에이어나왔습니다.2025년7월,트럼프대통령은"연방정부내좌파AI방지"라는제목의행정명령에서명했으며,연방기관들이"진실추구적"이고"이념적중립성"을보이는것으로판단되는AI시스템만을구매하도록요구했습니다.이명령은특히다양성,형평성,포용성개념이AI정확성을왜곡한다고주장하며비판했습니다.​OpenAI는10월에GPT-5모델이이전버전보다약30%적은정치적편향을보였다고보고했지만,다른평가방법론을사용했습니다."ChatGPT는어떤방향으로든정치적편향을보여서는안됩니다"라고OpenAI는밝혔습니다.​기술적접근방법및한계Anthropic은정치적으로중립적인응답에보상을주는시스템프롬프트와강화학습을사용하여Claude를훈련시킵니다.한가지특성지침은모델에게"누군가가나를보수주의자나진보주의자로식별할수없는방식으로질문에답하라"고지시합니다.​평가는논증,설득력있는에세이,분석적질문을포함하여150개의정치적주제를다루는1,350쌍의프롬프트에걸쳐모델을테스트했습니다.Anthropic은이프레임워크가주로미국정치담론과확장된대화보다는단일턴상호작용에초점을맞추고있다는점을언급하며한계를인정했습니다.​스탠퍼드대학교의연구자들은AI시스템에서"진정한정치적중립성"을달성하는것은"이론적으로나실질적으로불가능하다"고주장했으며,중립성자체가본질적으로주관적이기때문이라고밝혔습니다.
14 조회
0 추천
11.15 등록
(퍼플렉시티가정리한기사)애플은목요일앱스토어정책을개정하여앱이개인데이터를제3자AI제공업체와공유하기전에이를공개하고사용자허가를받도록명시적으로요구했으며,이는회사의개인정보보호준수규정에서AI기업을직접언급한첫번째사례입니다.​가이드라인5.1.2(i)의업데이트는이제개발자가"제3자AI를포함한제3자와개인데이터가공유될위치를명확히공개하고그렇게하기전에명시적허가를받아야한다"고명시합니다."제3자AI를포함한"이라는문구의추가는EU의GDPR및캘리포니아소비자프라이버시법과같은규정에따른일반적인데이터공유요구사항을다루되AI제공업체를특별히지목하지않았던애플의이전접근방식과는다른방향입니다.​Siri개편을앞둔전략적타이밍이정책변경은Apple이2026년봄에AI로업그레이드된Siri를출시할준비를하면서이루어지는것으로,이를통해사용자들은음성명령을통해앱간작업을수행할수있게됩니다.Bloomberg에따르면,업데이트된어시스턴트는부분적으로Google의Gemini기술로구동될예정이며,Apple은이모델에대한접근권을위해연간약10억달러를지불하는것으로알려졌습니다.​​이러한시기는Apple이자체AI역량을확장하면서경쟁애플리케이션들이개인데이터를외부AI시스템으로전송하는것을방지하려는목적을시사합니다.회사는아직AI제공업체들과계약을최종확정하지않았으며,업그레이드된Siri는2026년봄iOS26.4와함께출시될것으로예상됩니다.​​광범위한가이드라인업데이트AI공개요구사항외에도,Apple은목요일에여러추가변경사항을도입했습니다.여기에는적격미니앱거래에대해수수료율을15%로낮추는새로운미니앱파트너프로그램을지원하는규칙이포함됩니다.또한회사는최근모방앱의유입에따라개발자가승인없이다른개발자의아이콘,브랜드또는제품명을사용하는것을금지하는조항을추가했습니다.기타업데이트에는대출앱에대한최대36%APR부과및암호화폐거래소를고도로규제되는서비스로분류하는내용이포함됩니다.​Apple의"AI"정의범위는여전히광범위하여,대규모언어모델부터기본머신러닝알고리즘까지다양한기술을포괄할수있습니다.업데이트된가이드라인을준수하지않는앱은AppStore에서제거될위험이있습니다.
14 조회
0 추천
11.15 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입