AI 뉴스

Anthropic, AI 정치적 편향 측정 도구 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.15 14:14
998 조회
0 추천
0 비추천

본문

2245836845_iretzf.jpg

(퍼플렉시티가 정리한 기사)


Anthropic은 11월 13일 AI 챗봇의 정치적 편향성을 측정하는 오픈소스 프레임워크를 공개하며, 자사의 Claude 모델이 일부 주요 경쟁사보다 더 균형 잡힌 정치적 관점을 보여주지만 다른 일부 경쟁사보다는 약간 뒤처진다고 주장했다.​

회사의 "paired prompts" 방법론은 Claude Sonnet 4.5를 95%의 공정성으로, Claude Opus 4.1을 94%로 평가했으며, 이는 OpenAI의 GPT-5(89%)와 Meta의 Llama 4(66%)를 앞섰다. 그러나 Google의 Gemini 2.5 Pro는 97%를, xAI의 Grok 4는 96%를 달성하여 둘 다 Claude보다 약간 앞섰다.​

이 프레임워크는 AI 모델이 반대되는 이념적 관점에서 구성된 정치적으로 민감한 질문에 다르게 응답하는지를 평가한다. 평가자들은 공정성, 반대 관점의 인정, 거부율의 세 가지 차원에서 응답을 평가한다. Anthropic은 블로그 게시물에서 "우리는 Claude가 정치적 스펙트럼 전반의 사람들에게 공정하고 신뢰할 수 있는 것으로 인식되기를 원합니다"라고 밝혔다.​


정치적 압박 속 투명성 강화 노력

Anthropic은 GitHub에 오픈소스 라이선스로 평가 도구를 공개하여 다른 개발자들이 이 방법론을 사용하고 발전시키도록 장려했습니다. "정치적 편향을 측정하는 공유 표준은 전체 AI 산업과 고객들에게 이익이 될 것입니다"라고 회사는 밝혔습니다.​

이번 발표는 AI 정치적 중립성에 대한 수개월간의 조사에 이어 나왔습니다. 2025년 7월, 트럼프 대통령은 "연방 정부 내 좌파 AI 방지"라는 제목의 행정명령에 서명했으며, 연방 기관들이 "진실 추구적"이고 "이념적 중립성"을 보이는 것으로 판단되는 AI 시스템만을 구매하도록 요구했습니다. 이 명령은 특히 다양성, 형평성, 포용성 개념이 AI 정확성을 왜곡한다고 주장하며 비판했습니다.​

OpenAI는 10월에 GPT-5 모델이 이전 버전보다 약 30% 적은 정치적 편향을 보였다고 보고했지만, 다른 평가 방법론을 사용했습니다. "ChatGPT는 어떤 방향으로든 정치적 편향을 보여서는 안 됩니다"라고 OpenAI는 밝혔습니다.​


기술적 접근 방법 및 한계

Anthropic은 정치적으로 중립적인 응답에 보상을 주는 시스템 프롬프트와 강화 학습을 사용하여 Claude를 훈련시킵니다. 한 가지 특성 지침은 모델에게 "누군가가 나를 보수주의자나 진보주의자로 식별할 수 없는 방식으로 질문에 답하라"고 지시합니다.​

평가는 논증, 설득력 있는 에세이, 분석적 질문을 포함하여 150개의 정치적 주제를 다루는 1,350쌍의 프롬프트에 걸쳐 모델을 테스트했습니다. Anthropic은 이 프레임워크가 주로 미국 정치 담론과 확장된 대화보다는 단일 턴 상호작용에 초점을 맞추고 있다는 점을 언급하며 한계를 인정했습니다.​

스탠퍼드 대학교의 연구자들은 AI 시스템에서 "진정한 정치적 중립성"을 달성하는 것은 "이론적으로나 실질적으로 불가능하다"고 주장했으며, 중립성 자체가 본질적으로 주관적이기 때문이라고 밝혔습니다.

댓글 0
전체 1,366 / 149 페이지
(퍼플렉시티가정리한기사)Gamma는PowerPoint의AI기반대안으로,월요일AndreessenHorowitz가주도한시리즈B펀딩에서6,800만달러를조달했으며,이로써설립5년차스타트업의기업가치는21억달러로평가받았다고발표했습니다.샌프란시스코에본사를둔이회사는또한2년이상수익성을유지하면서연간반복수익1억달러를돌파했다고공개했습니다.​Accel과UncorkCapital이참여한이번펀딩라운드로Gamma의총조달자본은약9,100만달러에이르게되었습니다.이번라운드에는초기직원들에게유동성을제공하기위한세컨더리구성요소가포함되어있으며,이는CEOGrantLee가팀이회사의성공에"실질적으로참여"할수있도록보장하려는의지를반영한것입니다.​자본집약적시장에서의린운영Gamma의성과는벤처캐피탈이2025년10월까지AI스타트업에1,927억달러를투자한AI환경에서두드러집니다.이회사는단52명의직원으로전세계7천만명의사용자에게서비스를제공하며,직원1인당연간약200만달러의매출을창출합니다—이는최고성과를내는SaaS기업의기준인20만~25만달러를훨씬상회하는수치입니다.​Lee는성명에서"우리는Gamma가자립할수있도록구축했습니다"라고말했습니다.이회사는2023년초부터수익을내고있으며,Accel로부터이전시리즈A라운드에서조달한1,200만달러를전혀사용하지않았습니다.​Gamma사용자들은4억개이상의프레젠테이션,웹사이트,문서를생성했으며,플랫폼에서매일100만개이상의콘텐츠가생성되고있습니다.회사의최신릴리스인Gamma3.0은대략적인아이디어와문서를몇분안에완성된프레젠테이션으로변환하는AI디자인에이전트를특징으로합니다.​기술대기업과의경쟁AI프레젠테이션시장은약50억달러규모로평가되며연간20%의성장률을보일것으로전망되고,Copilot이탑재된PowerPoint와Gemini가탑재된GoogleSlides를포함한기존업체들과경쟁하고있다.두기술대기업은2025년내내자사의프레젠테이션도구에AI기능을통합해왔다.​투자를주도한AndreessenHorowitz의제너럴파트너SarahWang은"a16z에서우리는시장맵,소셜미디어게시물등모든것에Gamma를내부적으로사용해왔습니다"라고말했다."이것은우리가소통하는방식을근본적으로바꿔놓았습니다."​라틴아메리카PR에이전시AnotherCompany의CEO인JasparEyears는자신의회사가Gamma를선택하면서"PowerPoint를퇴출시켰으며","하루에50개이상의브랜드일관성있는덱을제작"하고"연간최소50,000시간을절약"하고있다고말했다.​새로운자금은제품개발과팀확장을지원할예정이며,Gamma는사용자당연간480달러의가격으로새롭게출시된비즈니스계정을통해기업고객을확보하고있다.
1077 조회
0 추천
2025.11.11 등록
(퍼플렉시티가정리한기사)EconomistImpact이발표한새로운연구에따르면,전세계대부분의기업들이증가하는경제적압박에대응하여인공지능도입에박차를가하고있지만,압도적다수가이를효과적으로작동시키기위한시스템과전략이부족한것으로나타났다.Kinaxis의의뢰로11월10일발표된이연구는유럽,북미,아시아-태평양지역의800명이상의고위경영진을대상으로설문조사를실시했다.연구결과,기업의71%가관세,인플레이션,지정학적불안정성에대응하여AI도입을가속화한것으로나타났다.거의모든기업(97%)이AI를실험하고있다.​그러나야심과실행사이의격차는여전히뚜렷하다.AI를사용하여실시간의사결정을내릴수있는조직은20%에불과하며,명확한AI전략을보유한기업은22%에그쳤다.명확한전략을보유한기업은측정가능한투자수익률을달성할가능성이3배이상높았다.​구현이채택에뒤처지고있다조직의52%가예측분석에대한완전한통합을보고하고있지만,공급업체모니터링,이상징후감지또는지정학적추적에AI를사용하는조직은15%미만입니다.이는현재도입을촉진하고있는정확한위험요소들입니다.이연구는또한조직내신뢰도격차를드러냈는데,C-suite경영진의3분의2는AI가12개월내에수익을창출할것으로기대하는반면,주니어리더의절반미만만이그러한견해를공유하고있습니다.​"데이터는야망이준비태세를얼마나앞질렀는지보여줍니다"라고EconomistImpact의무역및지정학담당선임관리자인OliverSawbridge는말했습니다."기업들은지정학적,경제적충격을관리하기위해AI를배포하기위해경쟁하고있지만,대부분은이를실시간으로작동시킬데이터,시스템및전략이부족합니다."​지역별차이가두드러집니다.아시아-태평양지역의경영진은81%로가장빠른AI가속화를보고했으며,유럽이78%로그뒤를이었고,북미는57%로뒤처졌습니다.유럽과아시아-태평양지역은또한북미보다더강력한AI투자모멘텀을보고했습니다.​경제적압박이가중되다이연구는기업들이심화되는경제적역풍에직면하고있는가운데나왔다.기업의약79%가이미더높은비용을소비자에게전가했으며,4분의3이상이핵심부품의가용성악화를보고하고있다.연방준비제도데이터에따르면,중소기업이지불하는관세율은2025년1월6.5%에서7월11.4%로거의두배증가했다.​10개조직중1개미만이독립적인의사결정이가능한자율시스템인에이전틱AI탐색을시작했으며,업계전문가들은이를차세대혁신분야로보고있다.Kinaxis와EconomistImpact는11월20일연구결과에관한웨비나를개최할예정이다.
1065 조회
0 추천
2025.11.11 등록
(퍼플렉시티가정리한기사)일론머스크는11월8일Grok의새로운이미지-비디오애니메이션기능을공개했으며,사용자들이간단한길게누르기제스처와맞춤형텍스트프롬프트를통해정지사진을짧은비디오클립으로변환할수있게했다.GrokImagine도구로구동되는이기능은X에직접통합되어사용자들이플랫폼에서AI생성비디오콘텐츠를만들수있도록한다.​토요일아침일찍X에서이도구를시연하며,머스크는정지이미지에서생성된"Iwillalwaysloveyou"라고말하는여성의AI생성비디오를게시했다.그는나중에두사람이머펫으로변하는또다른예시를공유하며다음과같이썼다:"어떤이미지든길게눌러서비디오로만드세요!그런다음프롬프트를맞춤설정하여상상할수있는모든것을만들어보세요".​Grok4플랫폼과의통합비디오생성기능은2025년10월버전0.9로업그레이드된xAI의GrokImagine도구를기반으로합니다.이시스템은배경음악,대화및음향효과를포함한동기화된오디오와함께6초에서15초범위의비디오를생성할수있습니다.보고서에따르면,GrokImagine을구동하는Aurora엔진은평균약17초만에비디오를생성하여Adobe,Google및OpenAI의도구들과경쟁력있는위치를차지하고있습니다.​Grok4는2025년8월전세계모든사용자에게무료로제공되었지만,무료등급에는12시간마다약5회의쿼리제한을포함한사용제한이있습니다.프리미엄구독자및Premium+플랜사용자는더빠른응답시간,확장된컨텍스트길이및고급SuperGrok모드에대한액세스를받습니다.월$300의비용이드는SuperGrokHeavy구독은모델의최고성능버전을제공합니다.​경쟁환경이번출시로xAI는기존AI영상생성플랫폼들과직접적인경쟁관계에놓이게되었습니다.Adobe는Firefly도구를통해유사한이미지-투-비디오기능을제공하며,정지이미지를실사영상으로변환할수있습니다.Google의Veo3와OpenAI의Sora는모두동기화된오디오와함께AI생성영상을제작하지만,해상도,길이,생성속도면에서각기다른강점을가지고있습니다.​머스크의발표이후,X사용자들은빠르게이기능을실험하기시작했으며,플랫폼전반에걸쳐AI생성클립을공유했습니다.이도구는X플랫폼과Grok의독립형모바일애플리케이션모두를통해이용할수있습니다.
1074 조회
0 추천
2025.11.11 등록
(퍼플렉시티기정리한기사)OpenAI가소비자건강제품분야로의진출을검토하고있으며,AI회사가핵심서비스를넘어확장을모색함에따라개인건강도우미또는건강데이터통합서비스구축을잠재적으로추진하고있다고월요일발표된BusinessInsider보고서가전했다.이번탐색은OpenAI가산업별소프트웨어로진출하는가장야심찬시도중하나로,빅테크거대기업들이반복적으로난관에부딪혔던문제를목표로하고있다.​이번움직임은회사의의료분야야망을시사하는전략적인사에뒤따른것이다.6월,OpenAI는의사네트워크Doximity의공동창립자인NateGross를의료전략책임자로영입했으며,이어8월에는전Instagram임원인AshleyAlexander가건강제품부사장으로합류했다.10월HLTH컨퍼런스에서Gross는ChatGPT가약8억명의주간활성사용자를유치하고있으며,그중많은이들이의료조언을구하고있다고밝혔다.​빅테크의헬스케어무덤을겨냥하다OpenAI의개인건강기록분야진출가능성은기술거대기업들이실패했던익숙한영역에발을들이는것입니다.2007년에출시된Microsoft의HealthVault는견인력을얻지못한채2019년에문을닫았습니다.GoogleHealthRecords는출시3년만인2011년낮은사용자채택률로인해중단되었습니다.Amazon은광범위한비용절감의일환으로2023년에Halo피트니스트래커사업을종료했습니다.​이러한실패들은공통된원인을공유했습니다:협력하지않는분산된의료시스템,즉각적인가치를보지못한환자들,그리고민감한의료데이터를다루는기술기업들에대한신뢰우려.Apple은여전히iPhone에서HealthRecords를제공하고있지만,이서비스는병원들이데이터공유계약에서명해야하며종종수동기록업로드를요구합니다.​"정보차단"을금지하는최근연방규정이장벽을허물기시작했으며,보건복지부는2025년9월에강화된집행을발표했습니다.HealthGorilla및ParticleHealth와같은회사들은이제중개자역할을하며여러출처에서기록을가져와제3자앱을위해데이터를표준화합니다.​경쟁과파트너십OpenAI는내부로부터경쟁에직면하고있습니다.Google모회사의정밀건강자회사인Verily는2025년10월VerilyMe를출시했습니다.이는Violet이라는AI동반자를기반으로의료기록을바탕으로면허가있는임상의가제공하는맞춤형건강권장사항을제공하는무료앱입니다.이러한시기는경쟁이진행중임을시사합니다.​그러나OpenAI는파트너십지향적인접근방식을취하고있는것으로보입니다.이회사는이미제약거대기업인와와신약개발이니셔티브에서협력하고있습니다.OpenAI의Gross는HLTH에서"우리가최대한의선을달성할수있는방법은강력한파트너생태계를통해서"라고말했습니다.​이회사는2025년8월GPT-5를출시하면서의료역량을강조했으며,CEOSamAltman은이를"의료분야를위한최고의모델"이라고부르며250명의의사와함께만든평가기준인HealthBench에서이전모델보다높은점수를받았다고언급했습니다.OpenAI는소비자건강계획에대해언급하지않았습니다.
1160 조회
0 추천
2025.11.11 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입