AI 뉴스

Anthropic, AI 정치적 편향 측정 도구 출시

페이지 정보

작성자 xtalfi
작성일 11.15 14:14
7 조회
0 추천
0 비추천

본문

2245836845_iretzf.jpg

(퍼플렉시티가 정리한 기사)


Anthropic은 11월 13일 AI 챗봇의 정치적 편향성을 측정하는 오픈소스 프레임워크를 공개하며, 자사의 Claude 모델이 일부 주요 경쟁사보다 더 균형 잡힌 정치적 관점을 보여주지만 다른 일부 경쟁사보다는 약간 뒤처진다고 주장했다.​

회사의 "paired prompts" 방법론은 Claude Sonnet 4.5를 95%의 공정성으로, Claude Opus 4.1을 94%로 평가했으며, 이는 OpenAI의 GPT-5(89%)와 Meta의 Llama 4(66%)를 앞섰다. 그러나 Google의 Gemini 2.5 Pro는 97%를, xAI의 Grok 4는 96%를 달성하여 둘 다 Claude보다 약간 앞섰다.​

이 프레임워크는 AI 모델이 반대되는 이념적 관점에서 구성된 정치적으로 민감한 질문에 다르게 응답하는지를 평가한다. 평가자들은 공정성, 반대 관점의 인정, 거부율의 세 가지 차원에서 응답을 평가한다. Anthropic은 블로그 게시물에서 "우리는 Claude가 정치적 스펙트럼 전반의 사람들에게 공정하고 신뢰할 수 있는 것으로 인식되기를 원합니다"라고 밝혔다.​


정치적 압박 속 투명성 강화 노력

Anthropic은 GitHub에 오픈소스 라이선스로 평가 도구를 공개하여 다른 개발자들이 이 방법론을 사용하고 발전시키도록 장려했습니다. "정치적 편향을 측정하는 공유 표준은 전체 AI 산업과 고객들에게 이익이 될 것입니다"라고 회사는 밝혔습니다.​

이번 발표는 AI 정치적 중립성에 대한 수개월간의 조사에 이어 나왔습니다. 2025년 7월, 트럼프 대통령은 "연방 정부 내 좌파 AI 방지"라는 제목의 행정명령에 서명했으며, 연방 기관들이 "진실 추구적"이고 "이념적 중립성"을 보이는 것으로 판단되는 AI 시스템만을 구매하도록 요구했습니다. 이 명령은 특히 다양성, 형평성, 포용성 개념이 AI 정확성을 왜곡한다고 주장하며 비판했습니다.​

OpenAI는 10월에 GPT-5 모델이 이전 버전보다 약 30% 적은 정치적 편향을 보였다고 보고했지만, 다른 평가 방법론을 사용했습니다. "ChatGPT는 어떤 방향으로든 정치적 편향을 보여서는 안 됩니다"라고 OpenAI는 밝혔습니다.​


기술적 접근 방법 및 한계

Anthropic은 정치적으로 중립적인 응답에 보상을 주는 시스템 프롬프트와 강화 학습을 사용하여 Claude를 훈련시킵니다. 한 가지 특성 지침은 모델에게 "누군가가 나를 보수주의자나 진보주의자로 식별할 수 없는 방식으로 질문에 답하라"고 지시합니다.​

평가는 논증, 설득력 있는 에세이, 분석적 질문을 포함하여 150개의 정치적 주제를 다루는 1,350쌍의 프롬프트에 걸쳐 모델을 테스트했습니다. Anthropic은 이 프레임워크가 주로 미국 정치 담론과 확장된 대화보다는 단일 턴 상호작용에 초점을 맞추고 있다는 점을 언급하며 한계를 인정했습니다.​

스탠퍼드 대학교의 연구자들은 AI 시스템에서 "진정한 정치적 중립성"을 달성하는 것은 "이론적으로나 실질적으로 불가능하다"고 주장했으며, 중립성 자체가 본질적으로 주관적이기 때문이라고 밝혔습니다.

댓글 0
전체 986 / 12 페이지
(퍼플렉시티가정리한기사)일본의요양원에서중국의공장현장까지,글로벌노동력을근본적으로재편할수있는새로운세대의휴머노이드로봇이등장하고있습니다.업계전망에따르면금세기중반까지10억대이상의이러한기계들이작동하며빨래개기부터자동차조립까지다양한작업을수행할것으로예측됩니다.NvidiaCEO젠슨황이"물리적AI"라고부르는것을향한추진은이번주여러발전과함께가속화되었습니다.중국자동차제조업체XPeng은11월5일광저우에서열린행사에서IRON휴머노이드로봇을공개했으며,CEO허샤오펑은회의론자들이사람이내부에숨어있는지의문을제기할정도로생생한기계를시연했습니다.이회사는2026년말까지고급로봇의대량생산을달성하는것을목표로하고있습니다.​도쿄에서는24세의히로야마모토의스타트업Enactic이일본의인력부족요양시설에서설거지와빨래를할수있는휴머노이드로봇을개발하고있습니다.이회사의OpenArm훈련장치는이미Nvidia와스탠포드를포함한최고대학들에서사용되고있습니다.야마모토는내년여름부터"매우혼란스러운환경에서사람들과함께생활할수있는"새로운로봇을배치할계획입니다.​시장폭발적성장예상MorganStanley는휴머노이드로봇시장이2050년까지5조달러에이를것으로전망하며,하드웨어시장만으로도연간매출4.7조달러를기록할것으로예상합니다.이투자은행은그해까지전세계적으로10억개이상의휴머노이드가운용되어인도의생산가능인구에맞먹는노동력을창출할것으로예측합니다.​시장은점진적으로성장할것이며,2035년까지약1,300만대가예상되고대부분은공장과창고에배치될것입니다.가격은현재20만달러에서선진국에서는5만달러로,중국공급망이지배적인지역에서는1만5천달러까지급락할수있습니다.​업계통합이시작되다일본의소프트뱅크(SoftBankGroupCorp.)는10월8일ABB의로봇부문을54억달러에인수한다고발표하며업계의대대적인통합을알렸다.소프트뱅크창립자손마사요시는이번거래가"초지능인공지능과로봇기술을결합해혁명적인변화를촉진할것"이라고말했다.​한편,미국-노르웨이스타트업1X는10월28일NEO휴머노이드홈어시스턴트의사전주문을시작했으며,가격은2만달러로2026년부터배송이시작된다.하지만초기시연에서는기술이여전히장애물을겪고있는모습이드러났으며,영상에서는NEO가식기세척기문을닫는데어려움을겪는장면이공개되었다.​XPeng의허샤오펑은"당사로봇이자율적으로걷고춤을출수있지만,공장노동자를대체하기에는아직멀었다"며,"로봇팔하나의비용만해도중국노동자여러해치의임금을넘을수있다"고밝혔다.그럼에도충분한데이터와훈련이있다면,휴머노이드로봇이"거의모든인간의역할"을eventually수행할수있을것이라고믿고있다.​BostonDynamics와토요타리서치인스티튜트는지난8월Atlas휴머노이드가단일신경망을통해전체로봇을제어하는대규모행동모델(LargeBehaviorModel)을활용하여복잡한포장및분류작업을수행할수있음을시연했다.​런던대학교(UCL)로봇공학조교수사라아델라아바드구아만(SaraAdelaAbadGuaman)은"자연은우리에게환경에적응하려면올바른신체가필요함을보여주었다"며,로봇의인공지능시스템과실제신체능력사이에는"큰격차"가있다고지적했다.
6 조회
0 추천
11.15 등록
(퍼플렉시티가정리한기사)런던은영국스타트업Wayve가이번달도시의까다로운거리에서레벨4로보택시테스트를시작하면서첫번째자율주행차시범운행을시작했으며,이는영국을자율주행차배치를위한글로벌경쟁에서경쟁자로자리매김하게했습니다.이번시범운행은영국정부의신속추진파일럿프로그램에따라2026년상용출시계획에앞서진행됩니다.​Wayve의FordMustangMach-E테스트차량은현재사전매핑된경로에의존하기보다는인간처럼운전을학습하는엔드투엔드신경망을사용하여북런던의좁고구불구불한거리를주행하고있습니다.Waymo와같이상세한지도와광범위한센서배열을사용하는경쟁업체와달리,Wayve의접근방식은앞유리위의작은센서박스만있으면되는적은하드웨어만필요로합니다.​자율성에대한다른접근법Wayve의기술은전통적인자율주행방식에서벗어난것을의미합니다.이회사의"AV2.0"시스템은경험을통해학습하고새로운환경에적응하는EmbodiedAI를사용하며,이는인간운전자가시간이지남에따라기술을습득하는방식과유사합니다.Wayve의CEO이자공동창립자인AlexKendall은"우리의EmbodiedAI는어디서든,어떤차량에서든운전을학습합니다"라고말했습니다.​이접근방식은최근시험주행에서그능력을입증했으며,무단횡단자부터주차된차량사이로걸어나오는시각장애보행자까지런던의악명높은예측불가능성을처리했습니다.그러나차량들은자전거이용자들뒤에서천천히따라가고교차로에서일반적인런던운전자들보다더오래정지하는등신중한행동을보였습니다.​2026년출시경쟁이번시험운행은Wayve와Waymo간의직접적인경쟁구도를형성하며,두회사모두2026년런던출시를목표로하고있습니다.Waymo는10월에무인차량호출서비스를영국수도에도입할계획을발표했으며,이는유럽최초의확장을의미합니다.이서비스는차량파트너Moove가관리하는완전전기JaguarI-Pace차량을사용할예정입니다.​한편Wayve는와파트너십을맺고2026년봄까지자율주행차량을상업적으로배치할계획입니다.영국정부의자율주행시범운행가속화프레임워크와함께6월에발표된이파트너십은영국을Uber의자율주행차량시험운행을위한최대시장으로만듭니다.HeidiAlexander교통부장관은이사업이2035년까지38,000개의일자리를창출하고경제에420억파운드를추가할수있다고밝혔습니다.​Wayve는,Microsoft,를포함한투자자들로부터10억달러이상을유치했으며,회사가치를80억달러로평가할수있는추가자금조달논의에대한보도도있었습니다.
6 조회
0 추천
11.15 등록
(퍼플렉시티가정리한기사)인공지능이맹렬한속도로발전함에따라,오래된철학적질문이새롭게주목받고있습니다:우리는컴퓨터시뮬레이션속에살고있는것일까요?최근AI세계구축기술의발전은시뮬레이션이론에새로운생명을불어넣는동시에고대종교교리와의놀라운유사점에대한대화를촉발시켰습니다.이번주애리조나주립대학교연구원이자MIT출신컴퓨터과학자인리즈완버크(RizwanVirk)의기사를통해논의가더욱가열되었습니다.이기사는시뮬레이션이론이수천년동안신비주의자들이숙고해온개념들과어떻게공명하는지를탐구합니다.버크는자신의2025년저서에대해쓰면서,현대AI도구들이이제광대한가상세계를창조한다는아이디어를"더이상그러한환상으로여겨지지않게"만들었다고주장합니다.​AI는불가능을가능하게만든다Google의2025년8월Genie3출시는이러한변화를잘보여줍니다.DeepMind월드모델은간단한텍스트프롬프트로부터720p해상도의상호작용가능한3D환경을생성하며,수분동안물리적일관성을유지합니다.이를2025년최고의발명품중하나로선정한TIME매거진에따르면,사용자들은이제"고대로마탐험을시뮬레이션"하거나"실제생활에서테스트하기에는너무위험한"시나리오에서AI에이전트를훈련시킬수있습니다.​철학자닉보스트롬의2003년논문으로대중화된시뮬레이션가설은,만약고도로발달한문명이의식을가진시뮬레이션을만들수있다면,우리자신도시뮬레이션속에살고있을가능성이높다고제안합니다.컬럼비아대학교의천문학자데이비드키핑은2020년에그확률을대략50대50으로계산했습니다.그러나브리티시컬럼비아대학교의최근연구는이를완전히반박합니다.10월말JournalofHolographyApplicationsinPhysics에발표된연구에서,미르파이잘박사가이끄는연구팀은괴델의불완전성정리를사용하여우주가시뮬레이션일수없음을수학적으로증명했습니다.파이잘은"모든시뮬레이션은본질적으로알고리즘적"이지만,현실은계산될수없는"비알고리즘적이해"를필요로한다고설명했습니다.​고대의지혜가현대기술을만나다버크의분석은시뮬레이션이론이여러전통에서의종교적개념을어떻게반영하는지보여준다.힌두교와불교의가르침에서는세상을‘마야’,즉환상으로설명하며—이는꿈에서깨어날수있다는관점과유사하다.오늘날게임에서흔히쓰이는아바타라는개념역시신성한존재가인간의형태로현신하는것을서술한산스크리트경전에서유래했다.심지어영혼과신체의관계도비슷한점이있다.만약의식이플레이어이고,신체가게임속캐릭터에불과하다면,종교에서말하는환생은가상세계에서여러라운드를플레이하는것과유사하다.​트랜스휴머니스트철학자데이비드피어스는보스트롬의논증을“2000년만에나온창조주의존재에대한첫흥미로운논증”이라고불렀으며,종교적창조서사와시뮬레이션이론이모두신의말씀또는컴퓨터코드와같은명령으로세상을창조한다는점을지적했다.​Genie3같은AI도구와하셈알-가일리의“프롬프트이론”단편영상등바이럴창작물들이현실과시뮬레이션의경계를모호하게만들면서,현실의본질에관한오래된질문은그어느때보다도절실하게다가오고있다.수학적으로불가능하다고하든,철학적으로깊이가있다고하든,시뮬레이션이론은최첨단기술과인간의영원한경탄사이의다리를계속해서놓아가고있다.
7 조회
0 추천
11.15 등록
(퍼플렉시티가정리한기사)Anthropic은11월13일AI챗봇의정치적편향성을측정하는오픈소스프레임워크를공개하며,자사의Claude모델이일부주요경쟁사보다더균형잡힌정치적관점을보여주지만다른일부경쟁사보다는약간뒤처진다고주장했다.​회사의"pairedprompts"방법론은ClaudeSonnet4.5를95%의공정성으로,ClaudeOpus4.1을94%로평가했으며,이는OpenAI의GPT-5(89%)와Meta의Llama4(66%)를앞섰다.그러나Google의Gemini2.5Pro는97%를,xAI의Grok4는96%를달성하여둘다Claude보다약간앞섰다.​이프레임워크는AI모델이반대되는이념적관점에서구성된정치적으로민감한질문에다르게응답하는지를평가한다.평가자들은공정성,반대관점의인정,거부율의세가지차원에서응답을평가한다.Anthropic은블로그게시물에서"우리는Claude가정치적스펙트럼전반의사람들에게공정하고신뢰할수있는것으로인식되기를원합니다"라고밝혔다.​정치적압박속투명성강화노력Anthropic은GitHub에오픈소스라이선스로평가도구를공개하여다른개발자들이이방법론을사용하고발전시키도록장려했습니다."정치적편향을측정하는공유표준은전체AI산업과고객들에게이익이될것입니다"라고회사는밝혔습니다.​이번발표는AI정치적중립성에대한수개월간의조사에이어나왔습니다.2025년7월,트럼프대통령은"연방정부내좌파AI방지"라는제목의행정명령에서명했으며,연방기관들이"진실추구적"이고"이념적중립성"을보이는것으로판단되는AI시스템만을구매하도록요구했습니다.이명령은특히다양성,형평성,포용성개념이AI정확성을왜곡한다고주장하며비판했습니다.​OpenAI는10월에GPT-5모델이이전버전보다약30%적은정치적편향을보였다고보고했지만,다른평가방법론을사용했습니다."ChatGPT는어떤방향으로든정치적편향을보여서는안됩니다"라고OpenAI는밝혔습니다.​기술적접근방법및한계Anthropic은정치적으로중립적인응답에보상을주는시스템프롬프트와강화학습을사용하여Claude를훈련시킵니다.한가지특성지침은모델에게"누군가가나를보수주의자나진보주의자로식별할수없는방식으로질문에답하라"고지시합니다.​평가는논증,설득력있는에세이,분석적질문을포함하여150개의정치적주제를다루는1,350쌍의프롬프트에걸쳐모델을테스트했습니다.Anthropic은이프레임워크가주로미국정치담론과확장된대화보다는단일턴상호작용에초점을맞추고있다는점을언급하며한계를인정했습니다.​스탠퍼드대학교의연구자들은AI시스템에서"진정한정치적중립성"을달성하는것은"이론적으로나실질적으로불가능하다"고주장했으며,중립성자체가본질적으로주관적이기때문이라고밝혔습니다.
8 조회
0 추천
11.15 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입