Loading...

AI 뉴스

Anthropic, AI 정치적 편향 측정 도구 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.15 14:14
941 조회
0 추천
0 비추천

본문

2245836845_iretzf.jpg

(퍼플렉시티가 정리한 기사)


Anthropic은 11월 13일 AI 챗봇의 정치적 편향성을 측정하는 오픈소스 프레임워크를 공개하며, 자사의 Claude 모델이 일부 주요 경쟁사보다 더 균형 잡힌 정치적 관점을 보여주지만 다른 일부 경쟁사보다는 약간 뒤처진다고 주장했다.​

회사의 "paired prompts" 방법론은 Claude Sonnet 4.5를 95%의 공정성으로, Claude Opus 4.1을 94%로 평가했으며, 이는 OpenAI의 GPT-5(89%)와 Meta의 Llama 4(66%)를 앞섰다. 그러나 Google의 Gemini 2.5 Pro는 97%를, xAI의 Grok 4는 96%를 달성하여 둘 다 Claude보다 약간 앞섰다.​

이 프레임워크는 AI 모델이 반대되는 이념적 관점에서 구성된 정치적으로 민감한 질문에 다르게 응답하는지를 평가한다. 평가자들은 공정성, 반대 관점의 인정, 거부율의 세 가지 차원에서 응답을 평가한다. Anthropic은 블로그 게시물에서 "우리는 Claude가 정치적 스펙트럼 전반의 사람들에게 공정하고 신뢰할 수 있는 것으로 인식되기를 원합니다"라고 밝혔다.​


정치적 압박 속 투명성 강화 노력

Anthropic은 GitHub에 오픈소스 라이선스로 평가 도구를 공개하여 다른 개발자들이 이 방법론을 사용하고 발전시키도록 장려했습니다. "정치적 편향을 측정하는 공유 표준은 전체 AI 산업과 고객들에게 이익이 될 것입니다"라고 회사는 밝혔습니다.​

이번 발표는 AI 정치적 중립성에 대한 수개월간의 조사에 이어 나왔습니다. 2025년 7월, 트럼프 대통령은 "연방 정부 내 좌파 AI 방지"라는 제목의 행정명령에 서명했으며, 연방 기관들이 "진실 추구적"이고 "이념적 중립성"을 보이는 것으로 판단되는 AI 시스템만을 구매하도록 요구했습니다. 이 명령은 특히 다양성, 형평성, 포용성 개념이 AI 정확성을 왜곡한다고 주장하며 비판했습니다.​

OpenAI는 10월에 GPT-5 모델이 이전 버전보다 약 30% 적은 정치적 편향을 보였다고 보고했지만, 다른 평가 방법론을 사용했습니다. "ChatGPT는 어떤 방향으로든 정치적 편향을 보여서는 안 됩니다"라고 OpenAI는 밝혔습니다.​


기술적 접근 방법 및 한계

Anthropic은 정치적으로 중립적인 응답에 보상을 주는 시스템 프롬프트와 강화 학습을 사용하여 Claude를 훈련시킵니다. 한 가지 특성 지침은 모델에게 "누군가가 나를 보수주의자나 진보주의자로 식별할 수 없는 방식으로 질문에 답하라"고 지시합니다.​

평가는 논증, 설득력 있는 에세이, 분석적 질문을 포함하여 150개의 정치적 주제를 다루는 1,350쌍의 프롬프트에 걸쳐 모델을 테스트했습니다. Anthropic은 이 프레임워크가 주로 미국 정치 담론과 확장된 대화보다는 단일 턴 상호작용에 초점을 맞추고 있다는 점을 언급하며 한계를 인정했습니다.​

스탠퍼드 대학교의 연구자들은 AI 시스템에서 "진정한 정치적 중립성"을 달성하는 것은 "이론적으로나 실질적으로 불가능하다"고 주장했으며, 중립성 자체가 본질적으로 주관적이기 때문이라고 밝혔습니다.

댓글 0
전체 1,366 / 88 페이지
(퍼플렉시티가정리한기사)OpenAI는월요일에GPT-5.1-Codex-Max를출시하며,복잡한다중시간프로그래밍프로젝트를다루는개발자들을위한획기적인최신에이전틱코딩모델로포지셔닝했습니다.내부적으로24시간개발작업을완료한것으로알려진이모델은컨텍스트를잃지않고수백만개의토큰에걸쳐일관되게작동할수있도록하는"압축(compaction)"기술을도입했습니다.​이번출시는Google이Gemini3Pro를공개한지하루만에이루어져,개발자도구시장에서AI거대기업들간의경쟁을심화시키고있습니다.OpenAI의발표에따르면,GPT-5.1-Codex-Max는이제모든Codex플랫폼에서GPT-5.1-Codex를대체하는기본모델이되었습니다.​성능향상및벤치마크결과GPT-5.1-Codex-Max는표준소프트웨어엔지니어링벤치마크인SWE-BenchVerified에서77.9%의정확도를달성하여,Gemini3Pro의보고된76.2%를근소하게앞질렀습니다.이모델은또한SWE-LancerICSWE에서79.9%를기록하여이전버전의66.3%와비교되며,TerminalBench2.0에서는58.1%에도달했습니다.​벤치마크점수를넘어,이모델은실질적인효율성개선을제공합니다.OpenAI는GPT-5.1-Codex-Max가실제코딩작업을완료할때GPT-5.1-Codex보다약30%적은토큰을사용하면서27%에서42%더빠르게작업을완료한다고보고합니다.ZDNET에따르면,이러한효율성향상은사용량제한이있는ChatGPTPlus구독자들에게잠재적으로추가1시간의프로그래밍시간으로환산됩니다.​압축시스템은주요아키텍처발전을나타내며,컨텍스트한계에접근할때필수정보를유지하면서세션기록을자동으로압축할수있게합니다.TheDecoder에따르면"모델이컨텍스트창을채우면자동으로세션기록을압축합니다".OpenAI의시스템카드는이모델이"압축이라는프로세스를통해여러컨텍스트창에걸쳐작동하도록기본적으로훈련된최초의모델"이라고명시합니다.​가용성및내부채택GPT-5.1-Codex-Max는ChatGPTPlus,Pro,Business,Edu및Enterprise사용자를위한Codex를통해즉시사용할수있습니다.OpenAI에따르면API액세스는"곧"제공될예정입니다.이모델은또한Windows환경에최적화된최초의Codex버전입니다.​OpenAI내부채택률은상당합니다.회사의10월발표에따르면,OpenAI엔지니어의95%가매주Codex를사용하고있으며,이도구를채택하기전과비교하여현재70%더많은풀리퀘스트를병합하고있습니다.OpenAI는"7월에절반을조금넘었던것에비해오늘날거의모든엔지니어가Codex를사용합니다"라고밝혔습니다.​이모델은프롬프트인젝션및데이터유출을포함한보안위험을완화하기위해기본적으로네트워크액세스가비활성화된샌드박스환경내에서작동합니다.
722 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)Google은이번주자율에이전트를통해소프트웨어개발을혁신하겠다는야심찬AI기반개발플랫폼Antigravity를공개했지만,초기사용자들은무료프리뷰를둘러싼초기흥분을가라앉힌상당한기술적장애물에직면하고있습니다.기술적문제가출시를방해하다11월17일Gemini3AI모델과함께발표된이플랫폼은빠른크레딧소진과신뢰성문제로비판을받고있습니다.HackerNews의사용자들은집중적으로사용한지약20분만에크레딧이소진되었으며,추가할당량을구매할수있는방법이없다고보고했습니다.한개발자는"내프로젝트에사용하기시작했는데약20분후에—오,안돼.크레딧이다떨어졌어요"라고쓰면서,경쟁플랫폼인Cursor로다시전환했다고덧붙였습니다.​기술저널리스트SimonWillison은테스트중에"모델공급자과부하로인해에이전트실행이종료되었습니다.나중에다시시도해주세요"라는오류메시지를받았다고기록했습니다.DevClass출판물도유사한문제를겪었으며,에이전트매니저가무한정사용중표시를나타내다가과부하메시지와함께종료되었습니다.​VisualStudioCode의포크로구축된Antigravity는AI에이전트가코드편집기,터미널및Chrome브라우저전반에걸쳐자율적으로작동하는"에이전트우선"개발패러다임을도입합니다.이플랫폼은Gemini3Pro,Anthropic의ClaudeSonnet4.5,OpenAIGPT-OSS를포함한여러AI모델을지원합니다.Google엔지니어KevinHou는이시스템이작업을위한세가지주요인터페이스를제공한다고설명했습니다:에이전트매니저창,코드편집기,자동화된브라우저.​보안우려사항및설계선택플랫폼의이용약관은"Antigravity는특정보안제한사항이있는것으로알려져있다"고명시적으로경고하며,데이터유출과코드실행을구체적인위험으로식별하고있습니다.이러한경고에도불구하고,기본구성은"에이전트지원개발"모드로작동하며,여기서AI는어떤작업이사람의승인을필요로하는지자율적으로결정합니다.​"이용약관은민감한데이터처리를피하고에이전트가수행하는모든작업을검증할것을권고합니다.하지만Google이이를진지하게받아들였다면에이전트에게상당한자율성을부여하는제품기본값을설정하지않았을것이라고생각할수있습니다"라고DevClass는언급했습니다.​추가적인문제점으로는GoogleWorkspace계정과의호환성문제가있으며,플랫폼의FAQ는사용자가개인Gmail주소로전환할것을권장합니다.또한플랫폼은더포괄적인VisualStudioCode마켓플레이스가아닌OpenVSX확장레지스트리에의존합니다.​어려운출시에도불구하고,Google은Antigravity를개발자가코드를직접작성하기보다AI에이전트를조율하는설계자로서작동하는"에이전트우선소프트웨어개발"의미래상으로포지셔닝하고있습니다.회사는Team및Enterprise가격책정등급이곧출시될것이라고밝혔지만,에이전트워크플로우의컴퓨팅집약적특성을고려할때현재무료등급의지속가능성은여전히불확실합니다.
727 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)YannLeCun은수요일에12년이상근무한를연말에떠나자신의인공지능스타트업을설립할것이라고발표했으며,이는소셜미디어거대기업의AI운영내지속적인격변속에서이분야의가장영향력있는선구자중한명의퇴사를의미한다.​65세의LeCun은LinkedIn게시물에서자신의새로운회사가AdvancedMachineIntelligence연구에집중할것이며,"물리적세계를이해하고,지속적인기억을가지며,추론할수있고,복잡한행동순서를계획할수있는"AI시스템을개발할것이라고밝혔다.Meta는이새로운벤처와파트너십을맺을예정이지만,협력의세부사항은아직불분명하다.​메타AI의불안정성시대이번퇴사는메타의AI부문이격동의시기를겪고있는가운데발생했습니다.10월에회사는슈퍼인텔리전스랩스에서약600개의직책을삭감했으며,이는LeCun이설립을도운기초AI연구부서에영향을미쳤습니다.이번주초,널리채택된PyTorch프레임워크의창시자인SoumithChintala가MiraMurati의스타트업에합류하기위해떠났습니다.​메타는올해ScaleAI의전CEO였던28세의AlexandrWang하에AI운영을극적으로재편했으며,그는메타가그의회사에143억달러를투자한후합류했습니다.재편성은훈련,연구,제품및인프라에집중하는네개의별개팀을만들었으며,회사의Llama4모델출시는내부적으로나외부적으로미온적인반응을얻었습니다.​갈라지는비전LeCun의Meta방향성과의철학적분열은최근몇달동안깊어졌습니다.Meta가OpenAI와Google과경쟁하기위해대규모언어모델에막대한투자를한반면,LeCun은그러한접근방식을"막다른길"이라고공개적으로비판하며,텍스트만으로훈련된AI는인간수준의지능을달성할수없다고주장했습니다.그의새로운스타트업은세계모델—물리적현실을이해하기위해비디오와공간데이터로부터학습하는AI시스템—을추구할것입니다.​LeCun은2013년Facebook에FAIR의창립이사로합류했으며,2018년이사직에서물러났지만수석AI과학자로는남아있습니다.그는딥러닝분야의혁신적업적으로GeoffreyHinton및YoshuaBengio와함께2019년튜링상을수상했습니다.그는뉴욕대학교에서시간제로계속강의할예정입니다.
757 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)Mastercard는2025년11월19일두바이에서AgentPay를선보였으며,이는미국외지역에서AI기반결제시스템을첫번째로도입한것입니다.두바이미래포럼에서대형유통업체MajidAlFuttaim및핀테크기업Dataiera와의파트너십을통해진행된이번출시는소비자가AI에이전트를사용하여음성명령만으로VOXCinemas영화티켓을포함한제품을검색,선택및구매할수있는방법을보여줍니다.​UAE인공지능부장관OmarSultanAlOlama와MastercardCEOMichaelMiebach는AI에이전트가사용자가웹사이트를탐색하거나결제정보를수동으로입력할필요없이공포영화티켓두장을구매하는플랫폼의첫실시간거래를목격했습니다.AlOlama는"UAE는일상생활을단순화하기위해인공지능을수용하고배포하는데있어새로운글로벌기준을설정했습니다"라고말했습니다.​혁신과보안의균형이번확장은Mastercard가U.S.Bank및Citibank와의초기출시에이어연말까지모든미국카드발급사에AgentPay를활성화할준비를하면서이루어졌습니다.이러한움직임은2025년10월에출시된Visa의TrustedAgentProtocol및Google의AgentPaymentsProtocol과함께점점더경쟁이치열해지는환경에서결제네트워크의입지를강화합니다.​그러나보안문제가이기술의급속한배포에그림자를드리우고있습니다.11월초Money20/20컨퍼런스의결제임원들은에이전트AI가사기위험을증폭시킬수있으며,FraudGPT와같은악성프로그램이연간1,400달러의낮은구독료로이용가능하다고경고했습니다.Experian의운영전략책임자인NashAli는"우리는지금에이전트AI가다가오면서사기의또다른폭발직전에서있습니다"라고말했습니다.​Miebach는이러한과제를인정하며"안전,보안및신뢰의문제가매우중요하다"고말하고강력한안전장치의필요성을강조했습니다.Visa의프로토콜은암호화서명을사용하여합법적인AI에이전트와악성봇을구별하며,업계관찰자들은구매결정에서AI자율성에대한고객의편안함에대한질문이지속되고있다고지적합니다.​UAE의전략적기반두바이출시는UAE인공지능청과의협력으로구축된마스터카드의2023년에미리트내첨단AI및사이버기술센터설립을기반으로합니다.마스터카드의동유럽,중동및아프리카지역사장인디미트리오스도시스는AgentPay가"에이전틱커머스가투명성,동의및보안을기반으로구축되도록보장한다"고말했습니다.​2025년시장보고서에따르면에이전틱커머스시장은2033년까지51억9천만달러에달할것으로예상됩니다.배포가가속화됨에따라업계는AI기반쇼핑이주류가되기전에책임프레임워크,사기예방및소비자신뢰문제를해결해야한다는압박에직면해있습니다.
747 조회
0 추천
2025.11.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입