AI 뉴스

Anthropic, AI 정치적 편향 측정 도구 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.15 14:14
908 조회
0 추천
0 비추천

본문

2245836845_iretzf.jpg

(퍼플렉시티가 정리한 기사)


Anthropic은 11월 13일 AI 챗봇의 정치적 편향성을 측정하는 오픈소스 프레임워크를 공개하며, 자사의 Claude 모델이 일부 주요 경쟁사보다 더 균형 잡힌 정치적 관점을 보여주지만 다른 일부 경쟁사보다는 약간 뒤처진다고 주장했다.​

회사의 "paired prompts" 방법론은 Claude Sonnet 4.5를 95%의 공정성으로, Claude Opus 4.1을 94%로 평가했으며, 이는 OpenAI의 GPT-5(89%)와 Meta의 Llama 4(66%)를 앞섰다. 그러나 Google의 Gemini 2.5 Pro는 97%를, xAI의 Grok 4는 96%를 달성하여 둘 다 Claude보다 약간 앞섰다.​

이 프레임워크는 AI 모델이 반대되는 이념적 관점에서 구성된 정치적으로 민감한 질문에 다르게 응답하는지를 평가한다. 평가자들은 공정성, 반대 관점의 인정, 거부율의 세 가지 차원에서 응답을 평가한다. Anthropic은 블로그 게시물에서 "우리는 Claude가 정치적 스펙트럼 전반의 사람들에게 공정하고 신뢰할 수 있는 것으로 인식되기를 원합니다"라고 밝혔다.​


정치적 압박 속 투명성 강화 노력

Anthropic은 GitHub에 오픈소스 라이선스로 평가 도구를 공개하여 다른 개발자들이 이 방법론을 사용하고 발전시키도록 장려했습니다. "정치적 편향을 측정하는 공유 표준은 전체 AI 산업과 고객들에게 이익이 될 것입니다"라고 회사는 밝혔습니다.​

이번 발표는 AI 정치적 중립성에 대한 수개월간의 조사에 이어 나왔습니다. 2025년 7월, 트럼프 대통령은 "연방 정부 내 좌파 AI 방지"라는 제목의 행정명령에 서명했으며, 연방 기관들이 "진실 추구적"이고 "이념적 중립성"을 보이는 것으로 판단되는 AI 시스템만을 구매하도록 요구했습니다. 이 명령은 특히 다양성, 형평성, 포용성 개념이 AI 정확성을 왜곡한다고 주장하며 비판했습니다.​

OpenAI는 10월에 GPT-5 모델이 이전 버전보다 약 30% 적은 정치적 편향을 보였다고 보고했지만, 다른 평가 방법론을 사용했습니다. "ChatGPT는 어떤 방향으로든 정치적 편향을 보여서는 안 됩니다"라고 OpenAI는 밝혔습니다.​


기술적 접근 방법 및 한계

Anthropic은 정치적으로 중립적인 응답에 보상을 주는 시스템 프롬프트와 강화 학습을 사용하여 Claude를 훈련시킵니다. 한 가지 특성 지침은 모델에게 "누군가가 나를 보수주의자나 진보주의자로 식별할 수 없는 방식으로 질문에 답하라"고 지시합니다.​

평가는 논증, 설득력 있는 에세이, 분석적 질문을 포함하여 150개의 정치적 주제를 다루는 1,350쌍의 프롬프트에 걸쳐 모델을 테스트했습니다. Anthropic은 이 프레임워크가 주로 미국 정치 담론과 확장된 대화보다는 단일 턴 상호작용에 초점을 맞추고 있다는 점을 언급하며 한계를 인정했습니다.​

스탠퍼드 대학교의 연구자들은 AI 시스템에서 "진정한 정치적 중립성"을 달성하는 것은 "이론적으로나 실질적으로 불가능하다"고 주장했으며, 중립성 자체가 본질적으로 주관적이기 때문이라고 밝혔습니다.

댓글 0
전체 1,366 / 103 페이지
(퍼플렉시티가정리한기사)엘론머스크의인공지능스타트업xAI는2025년11월17일Grok4.1을출시하며정확도에서극적인개선을이루고업계에서가장경쟁이치열한벤치마크중하나에서선두자리를차지했습니다.이모델은AI가거짓이거나무의미한정보를생성하는환각현상을이전버전에비해약3분의2감소시켰습니다.​xAI에따르면,Grok4.1의환각비율은Grok4Fast의12.09%에서단4.22%로감소했으며,FActScore지표는9.89%에서2.97%로개선되었습니다.이모델은현재LMArena의TextArena리더보드에서사고모드로1483의Elo점수로1위를차지하고있으며,빠른모드에서는1465점으로2위를기록하고있습니다—이는가장가까운비xAI모델보다31점앞선수치입니다.​감성지능과창의적성장정확도향상을넘어,Grok4.1은감성지능분야에서EQ-Bench3에서1586점,CreativeWritingv3에서1722점의기록적인점수를달성했으며,이는xAI의이전최고기록대비600점향상된수치입니다.회사는이러한발전이성격일관성과미묘한의도감지에초점을맞춘강화학습시스템덕분이라고밝혔습니다.​11월1일부터14일까지진행된조용한출시기간동안,xAI는모델을실제트래픽에노출시키고지속적인블라인드선호도테스트를실시했으며,Grok4.1은이전프로덕션모델대비64.8%의선호도를기록했습니다.ArenaExpert리더보드에서씽킹버전은1510점을기록했으며,표준버전은1437점으로19위를차지했습니다.​프리미엄옵션이포함된무료액세스이모델은grok.com,X,모바일앱을통해전세계모든사용자에게무료로제공되며,이는유료장벽없이최첨단모델을제공하는xAI의패턴을이어가고있습니다.XPremium+구독자를포함한프리미엄등급은더높은사용한도를받습니다.회사는테네시주멤피스에있는Colossus슈퍼컴퓨터를사용하여Grok4.1을구축했으며,이시스템은200,000개이상의GPU를보유하고있으며세계최대AI훈련시스템으로간주됩니다.​이번출시는AI부문에서경쟁이심화되는가운데이루어졌으며,Google이연말까지Gemini3.0출시를준비하고있는것으로알려졌습니다.OpenAI는최근자체성능개선과함께GPT5.1을출시했습니다.
877 조회
0 추천
2025.11.18 등록
(퍼플렉시티가정리한기사)구글딥마인드와구글리서치는11월17일WeatherNext2를공개했습니다.이는이전버전보다8배빠른예측을제공하고시간별해상도예보를제공하는고급AI날씨예측모델입니다.이모델은단일처리칩에서1분이내에수백가지의가능한날씨시나리오를생성할수있으며,이는기존슈퍼컴퓨터로는몇시간이걸리는작업입니다.​WeatherNext2는0일에서15일까지의예측리드타임에걸쳐온도,바람,습도를포함한99.9%의날씨변수에서구글의이전모델을능가합니다.이기술은이미구글검색,Gemini,PixelWeather,그리고구글맵스플랫폼의WeatherAPI에서날씨예보를지원하고있으며,앞으로몇주내에구글맵스에도통합될예정입니다.​향상된예측및비즈니스애플리케이션이모델은열대폭풍경로를최대3일전에예측하는데특히강점을보이며,이는이전버전보다하루개선된것입니다.DeepMindAI연구원AkibUddin에따르면,시간별예보는에너지거래자및기타산업에특히유용합니다.Uddin은Bloomberg와의인터뷰에서"더세밀한예보를제공합니다"라고말했습니다."많은다른산업들이이러한1시간단위에상당한관심을보이고있습니다.이를통해더정확한의사결정을할수있습니다".​이혁신은FunctionalGenerativeNetwork라는새로운접근방식에서비롯되었으며,이는온도나풍속과같은개별기상요소만으로모델을훈련시키지만,지역열파나풍력발전소출력과같은복잡하게상호연결된시스템을예측할수있게합니다.​한계점및경쟁환경발전에도불구하고,DeepMind연구과학자FerranAlet은훈련데이터의공백으로인해이모델이이상치강우및강설사건을예측하는데어려움을겪을가능성이있다고인정했습니다."이것은우리예보의한가지한계이지만,우리가개선하기위해노력하고있는부분입니다"라고Alet은Bloomberg에말했습니다.​WeatherNext2는현재GoogleCloudVertexAI,BigQuery,EarthEngine을통해기업과연구자들에게제공되고있습니다.이모델은,,AccuWeather,Huawei를포함한회사들이모두AI기반기상예보시스템을개발하고있는점점더경쟁적인분야에진입했습니다.
761 조회
0 추천
2025.11.18 등록
(퍼플렉시티가정리한기사)일론머스크의출시한지한달된위키피디아대체서비스인그로키피디아(Grokipedia)가수천개의"의심스러운"그리고"문제가있는"출처를인용하고있어AI기반백과사전의신뢰성에대한심각한의구심을불러일으키고있다고코넬테크연구진이금요일발표한연구결과가밝혔다.​연구에따르면위키피디아에서복사되지않은그로키피디아문서는영어위키피디아커뮤니티에서"일반적으로신뢰할수없는"것으로간주되는출처를인용할가능성이3.2배더높고,위키피디아가완전히차단하는"블랙리스트"출처를포함할가능성이13배더높은것으로나타났다.인용중에는스톰프론트(Stormfront)와인포워즈(InfoWars)를포함한극우매체에대한수십건의참조가포함되어있다.​코넬테크연구진인해롤드트리드먼(HaroldTriedman)과알렉시오스만차를리스(AlexiosMantzarlis)는보고서에서"그로키피디아에서는출처관련안전장치가대부분제거된것이분명하다"고썼다."이로인해의심스러운출처가포함되고,잠재적으로문제가있는출처의전반적인비율이더높아지게된다."​논란속에출범한위키백과경쟁서비스머스크의회사xAI는10월27일80만개이상의AI생성기사를담은그로키피디아를출시하며,머스크가"위키피디아보다엄청난개선"이라고부른것으로포지셔닝했다.이억만장자는오랫동안위키피디아를좌파편향이라고비난해왔으며,이를"Wokepedia"라고부르고작년에2억명이상의X팔로워들에게비영리단체에기부를중단할것을촉구했다.​그러나이플랫폼은정확성문제로빠르게비판을받았다.PolitiFact는그로키피디아가존재하지않는출처를인용하거나참조된정보를포함하지않는출처를인용하는등허위인용을자주만들어낸다는것을발견했다.한사례에서,백과사전은파이스트의아버지가2021년에사망했다는Vice기사를인용했는데,실제기사는2017년것이었고사망에대한언급이없었으며당시그녀의아버지는여전히살아있었다.​위키피디아공동창립자지미웨일스는이프로젝트를일축하며CNBC에대규모언어모델이"대규모오류"를만들어낼것이라고말했다."저는그로키피디아를철저히검토할기회가없었고,흥미롭게생각하지만,일론머스크의탁월함에대한찬사로가득차있는것같습니다"라고웨일스는말했다.​투명성격차와이념적우려공개편집을허용하고변경사항과출처에대한상세한기록을유지하는위키백과와달리,그로키피디아는기사가AI로생성되었다는점을인정하는것외에는기사작성방법에대한어떠한통찰도제공하지않습니다.사용자는양식을통해피드백을제출할수는있지만항목을직접편집할수는없습니다.​이플랫폼은논란의여지가있는주제를다루는방식으로특히면밀한조사를받았습니다.한분석에따르면,그로키피디아의1월6일국회의사당공격에대한항목은사건자체보다언론보도에대한이의제기에더초점을맞추고있습니다.이백과사전에는또한InfoWars를인용하는"클린턴시체수"음모론을홍보하는기사도포함되어있습니다.​코넬공대연구결과에대한논평요청을받았을때,xAI는"레거시미디어는거짓말을한다(LegacyMediaLies)"라는자동응답을보냈습니다.목요일,머스크는그로키피디아가"충분히좋아지면(아직갈길이멀지만)""은하백과사전(EncyclopediaGalactica)"으로브랜드를변경할계획이라고발표했습니다.
806 조회
0 추천
2025.11.18 등록
(퍼플렉시티가정리한기사)AI에이전트시스템의보안취약점을해결하는새로운스타트업이월요일1,100만달러의시드펀딩과이미계약을체결한8개의유니콘고객사를확보하며출범했습니다.세번째창업에나선앤드류버먼(AndrewBerman)이설립한Runlayer는AI에이전트가기업데이터및시스템과상호작용할수있도록하는새로운표준인모델컨텍스트프로토콜(ModelContextProtocol)에대한포괄적인보안을구축하기위해KhoslaVentures의키스라보이스(KeithRabois)와Felicis로부터투자를확보했습니다.​이회사는제품출시후불과4개월만에스텔스모드에서벗어났으며,이미Gusto,Rippling,dbtLabs,Instacart,Opendoor,Ramp를포함한수십개의고객사와계약을체결했습니다.Runlayer는또한Anthropic에서MCP의수석개발자인데이비드소리아파라(DavidSoriaParra)를엔젤투자자및고문으로영입했습니다.​보안침해가긴급한필요성을촉진하다2024년11월Anthropic이오픈소스로출시한ModelContextProtocol(MCP)은AI에이전트가인간의감독없이데이터에접근하고이동시키며변경할수있게해주는사실상의표준이되었습니다.OpenAI,Microsoft,AmazonWebServices,Google을비롯한주요모델제작사뿐만아니라수천개의기술기업들이이제이프로토콜을지원하고있습니다.​그러나MCP는본질적으로내장된보안기능이부족하여,실제배포된구현들에서여러취약점이발견되었습니다.2025년5월InvariantLabs의연구원들은MCP서버에서프롬프트인젝션취약점을발견했으며,이를통해무단으로비공개GitHub저장소에접근할수있었습니다.이듬달에는Asana가자사의MCP서버에서서로다른조직간의고객데이터가누출될수있는취약점을발견하고이를수정했습니다.​TechCrunch에따르면이러한보안문제들로인해Cloudflare,Docker,Wiz를비롯한여러회사들이다양한MCP보안제품을출시하게되었습니다.​올인원플랫폼접근방식Runlayer는단일솔루션이아닌종합적인보안을제공함으로써붐비는시장에서차별화를추구하고있습니다.이플랫폼은게이트웨이보안과모든MCP요청을분석하는위협탐지,허가된MCP서버전반의관찰성모니터링,맞춤형AI자동화를구축할수있는엔터프라이즈개발도구,그리고Okta와같은신원제공자와통합되는세분화된권한기능을결합합니다.​과거유아용모니터제조업체인Nanit와AI영상회의툴Vowel을설립했던버먼은2024년3월Vowel을매각한뒤Zapier의AI디렉터가되었습니다.그는Zapier에서최초의MCP서버중하나를구축하면서OpenAI및Anthropic과긴밀히협력했습니다.이후2025년8월,공동창업자인탈페레츠,비토르발로코와함께Zapier를떠나Runlayer를설립했습니다.
877 조회
0 추천
2025.11.18 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입