AI 뉴스

Anthropic, AI 정치적 편향 측정 도구 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.15 14:14
920 조회
0 추천
0 비추천

본문

2245836845_iretzf.jpg

(퍼플렉시티가 정리한 기사)


Anthropic은 11월 13일 AI 챗봇의 정치적 편향성을 측정하는 오픈소스 프레임워크를 공개하며, 자사의 Claude 모델이 일부 주요 경쟁사보다 더 균형 잡힌 정치적 관점을 보여주지만 다른 일부 경쟁사보다는 약간 뒤처진다고 주장했다.​

회사의 "paired prompts" 방법론은 Claude Sonnet 4.5를 95%의 공정성으로, Claude Opus 4.1을 94%로 평가했으며, 이는 OpenAI의 GPT-5(89%)와 Meta의 Llama 4(66%)를 앞섰다. 그러나 Google의 Gemini 2.5 Pro는 97%를, xAI의 Grok 4는 96%를 달성하여 둘 다 Claude보다 약간 앞섰다.​

이 프레임워크는 AI 모델이 반대되는 이념적 관점에서 구성된 정치적으로 민감한 질문에 다르게 응답하는지를 평가한다. 평가자들은 공정성, 반대 관점의 인정, 거부율의 세 가지 차원에서 응답을 평가한다. Anthropic은 블로그 게시물에서 "우리는 Claude가 정치적 스펙트럼 전반의 사람들에게 공정하고 신뢰할 수 있는 것으로 인식되기를 원합니다"라고 밝혔다.​


정치적 압박 속 투명성 강화 노력

Anthropic은 GitHub에 오픈소스 라이선스로 평가 도구를 공개하여 다른 개발자들이 이 방법론을 사용하고 발전시키도록 장려했습니다. "정치적 편향을 측정하는 공유 표준은 전체 AI 산업과 고객들에게 이익이 될 것입니다"라고 회사는 밝혔습니다.​

이번 발표는 AI 정치적 중립성에 대한 수개월간의 조사에 이어 나왔습니다. 2025년 7월, 트럼프 대통령은 "연방 정부 내 좌파 AI 방지"라는 제목의 행정명령에 서명했으며, 연방 기관들이 "진실 추구적"이고 "이념적 중립성"을 보이는 것으로 판단되는 AI 시스템만을 구매하도록 요구했습니다. 이 명령은 특히 다양성, 형평성, 포용성 개념이 AI 정확성을 왜곡한다고 주장하며 비판했습니다.​

OpenAI는 10월에 GPT-5 모델이 이전 버전보다 약 30% 적은 정치적 편향을 보였다고 보고했지만, 다른 평가 방법론을 사용했습니다. "ChatGPT는 어떤 방향으로든 정치적 편향을 보여서는 안 됩니다"라고 OpenAI는 밝혔습니다.​


기술적 접근 방법 및 한계

Anthropic은 정치적으로 중립적인 응답에 보상을 주는 시스템 프롬프트와 강화 학습을 사용하여 Claude를 훈련시킵니다. 한 가지 특성 지침은 모델에게 "누군가가 나를 보수주의자나 진보주의자로 식별할 수 없는 방식으로 질문에 답하라"고 지시합니다.​

평가는 논증, 설득력 있는 에세이, 분석적 질문을 포함하여 150개의 정치적 주제를 다루는 1,350쌍의 프롬프트에 걸쳐 모델을 테스트했습니다. Anthropic은 이 프레임워크가 주로 미국 정치 담론과 확장된 대화보다는 단일 턴 상호작용에 초점을 맞추고 있다는 점을 언급하며 한계를 인정했습니다.​

스탠퍼드 대학교의 연구자들은 AI 시스템에서 "진정한 정치적 중립성"을 달성하는 것은 "이론적으로나 실질적으로 불가능하다"고 주장했으며, 중립성 자체가 본질적으로 주관적이기 때문이라고 밝혔습니다.

댓글 0
전체 1,366 / 95 페이지
(퍼플렉시티가정리한기사)LG생활건강은화요일자사의웨어러블뷰티기기인하이퍼리쥬버네이팅아이패치(HyperRejuvenatingEyePatch)가뷰티테크부문에서CES2026혁신상을수상했다고발표했으며,이는세계최대소비자가전전시회에서동사가받은첫번째수상이다.이번수상은뷰티브랜드들이인공지능과웨어러블기술을스킨케어솔루션에점점더통합하고있는가운데이루어졌다.​이기기는AI기반피부분석,생체모방패치기술,그리고제어된LED광치료를결합하여눈가의노화징후를타겟으로한다.60,000명의데이터베이스를활용하여AI기반진단프로그램을통해주름,색소침착및다크서클을분석한후,맞춤형화장품성분을추천하고문어흡반을모방한음압패치를통해전달한다.​문어에서영감을받은기술이기기의핵심은성균관대학교교수가설립한스타트업Mimetics와의파트너십을통해개발된음압패치입니다.Nature및ACSNano에게재된연구에따르면,문어빨판의원리를사용하여피부손상없이흡수를강화하는이패치기술은기존화장품보다5~6배높은흡수율을자랑합니다.이기술은4월LG생활건강의럭셔리브랜드TheHistoryofWhoo에서SkinActivatorPatch라는이름으로처음시장에출시되었습니다.​핸즈프리밴드형기기는또한1mm미만두께의유연한LED패치를통합하여더깊은피부층에최적화된광치료를제공합니다.공식CES설명에따르면,이시스템은눈주위영역을마이크로존으로세분화하고개인피부분석을기반으로정밀하게제어된광프로토콜을제공합니다.​광범위한뷰티테크추진이번수상은LG생활건강이스킨롱제버티(SkinLongevity)이니셔티브하에개인맞춤형뷰티기술에대한집중을확대하고있음을반영한다.강내규최고기술책임자(CTO)는회사가"미래뷰티기술연구를통해새로운고객경험을제공하기위해차세대웨어러블기기와개인맞춤형솔루션을지속적으로통합할것"이라고밝혔다.JournalofInvestigativeDermatology에발표된최근연구는연령과유전적소인모두를기반으로맞춤화를가능하게하는6가지주요노화지표와10가지유전바이오마커를확인했다.​LG생활건강은AI뷰티기술분야에서경쟁에직면해있다.아모레퍼시픽은MIT와함께개발한전자피부플랫폼으로노화원인을실시간으로분석하는스킨사이트(Skinsight)로올해7년연속CES혁신상을수상했다.​CES2026혁신상프로그램은36개부문에서3,600개이상의출품작을접수했으며,AI,디지털헬스,지속가능성부문이가장많은출품작을받았다.수상자들은1월6일부터9일까지라스베이거스에서열리는CES2026에서자사제품을선보일예정이다.
887 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)구글이18일(현지시간)차세대인공지능(AI)모델'제미나이3'를공개하고핵심서비스인검색에출시당일부터즉시적용하는파격적인행보를보였다.이는구글이신규AI모델을검색엔진에첫날부터통합한첫사례로,AI경쟁에서공세적전략으로전환했음을시사한다.​순다르피차이구글최고경영자(CEO)는"제미나이3는전례없는수준의깊이와뉘앙스를이해할수있도록설계된최첨단추론능력을갖춘가장지능적인모델"이라고밝혔다.제미나이2.5출시이후약8개월만에등장한이번모델은주요AI성능지표에서오픈AI의GPT-5와앤스로픽의클로드를제치고1위를차지했다.​벤치마크성적으로경쟁사압도제미나이3프로는사용자직접평가방식인LM아레나리더보드에서1501점을기록해그록4.1(1484점)과클로드소넷4.5(1449점)를앞질렀다.박사급추론능력을측정하는'인류마지막시험'벤치마크에서는도구사용없이37.5%를달성해GPT-5프로의30.7%를크게상회했다.고난도수학문제로구성된매스아레나에이펙스에서는23.4%를기록하며GPT-5.1의1%를압도적으로넘어섰다.​코딩능력평가인웹데브아레나리더보드에서도제미나이3는1487점으로GPT-5(1473점)와클로드오퍼스4.1(1451점)을제쳤다.구글은더강화된추론모드인'제미나이3딥싱크'도공개했는데,이모델은인류마지막시험에서41%의정답률로역대최고기록을세웠다.​검색통합으로실용성강화구글은제미나이3프로를출시와동시에검색엔진의'AI모드',제미나이앱,AI스튜디오및버텍스AI등주요제품전반에즉시적용했다.구글의최고AI설계책임자인코라이카부크쿠오글루는"제미나이가모델출시속도뿐아니라사용자에게전달되는속도면에서도새로운기준을세웠다"고말했다.​미국내유료구독자는검색창에서'AI모드'탭을통해제미나이3의복잡한추론능력과새로운동적경험을즉시활용할수있다.구글은또한AI에이전트가소프트웨어작업을자율적으로계획하고실행할수있는개발플랫폼'안티그래비티'도함께공개했다.​구글이마이크로소프트의연례개발자회의'이그나이트2025'개최일에맞춰제미나이3출시를발표한것은경쟁기술기업견제목적이있는것으로풀이된다.인디펜던트분석기관아티피셜애널리시스는"제미나이3프로가현재시장을선도하고있으며GPT-5.1보다3점높은점수를기록했다"고평가했다.
806 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)"에이전틱AI"라는용어는최근몇주동안기술분야를휩쓸었으며,기업들이자율적인인공지능시스템을중심으로자사제품을포지셔닝하기위해서두르면서업계컨퍼런스와마케팅자료를지배하고있다.그러나이용어의급속한확산은이것이진정한기술적변화를나타내는것인지,아니면단순히기존AI기능의리브랜딩에불과한것인지에대한논쟁을촉발시켰다.MIT슬론리뷰(MITSloanReview)에따르면,"합의된정의는없지만,에이전틱AI는일반적으로지속적인인간의감독없이결정을내리고,행동을취하며,역동적인환경에적응함으로써자율적으로목표를추구할수있는AI시스템을의미한다".AP통신은월요일에거대기술기업과스타트업들이자사제품설명에"에이전틱"을포함시키면서이표현이"마케팅과장과실제가능성의혼합"이되었다고보도했다.​산업모멘텀형성주요기술기업들이이번달업계행사에서주목할만한에이전트AI발표를진행했습니다.Microsoft는11월17일Ignite컨퍼런스에서Agent365를공개하며,이를플랫폼전반에걸쳐AI에이전트를관리하는"제어플레인"이라고설명했습니다.Google은11월에프로덕션급에이전트시스템의표준을확립하는54페이지분량의기술가이드라인을발표했으며,Amazon은11월16일자율에이전트를위한엔터프라이즈인프라를제공하는AmazonBedrockAgentCore를소개했습니다.​Salesforce는10월Dreamforce컨퍼런스에서AI제품을"Agentforce"로리브랜딩하며,"인간과AI에이전트를연결하도록설계된세계최초의플랫폼"을제공한다고자사를포지셔닝했습니다.IBM도WatsonxOrchestrate플랫폼에서에이전트기능을마찬가지로강조해왔습니다.​시장전망및채택산업분석가들은에이전트AI기술의상당한성장을전망하고있습니다.딜로이트는생성형AI를사용하는기업의25%가2025년에에이전트AI파일럿을시작할것이며,2027년에는도입률이50%로두배증가할것으로예측했습니다.가트너는2026년까지기업용애플리케이션의40%가작업별AI에이전트를통합할것으로예상하며,이는현재5%미만에서증가한수치입니다.​맥킨지연구에따르면에이전트AI는2030년까지연간4,500억달러에서6,500억달러의추가매출을창출할수있으며,구글클라우드는시장규모가2035-2040년까지1조달러에달할수있을것으로전망합니다.그러나가트너는10월에현재에이전트AI제품의공급이수요를크게초과하고있으며시장통합을예측한다고경고했습니다.​비평가들은기업들이진정한자율기능을제공하지않으면서기본적인AI워크플로우를에이전트로표시하는"에이전트워싱"에대한우려를제기했습니다.포브스는"에이전트워싱은기업들이현재의과대광고사이클을이용하는데도움이될수있지만비용이따른다"고지적하며,"사용자를혼란스럽게하고,고객을실망시키며,진정으로혁신적인도구를채택하는과정을방해한다"고경고했습니다.
762 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)Microsoft는화요일샌프란시스코에서열린Ignite2025컨퍼런스에서Agent365를공개하며,조직이운영전반에걸쳐확산되는AI에이전트를추적,보호및관리할수있도록설계된중앙집중식플랫폼을선보였습니다.​이플랫폼은리서치기업IDC에따르면2028년까지전세계적으로배포되는AI에이전트수가13억개로급증하면서중요한과제가될것으로애널리스트들이예측하는문제를해결합니다.Agent365는IT관리자에게Microsoft의도구로구축되었든타사플랫폼으로구축되었든관계없이조직내에서작동하는모든AI에이전트를모니터링할수있는통합대시보드를제공합니다.​"Agent365는에이전트를위한제어플레인으로,사람을관리하기위해신뢰하는인프라를에이전트로확장합니다"라고Microsoft의AIatWork최고마케팅책임자인JaredSpataro가블로그게시물에작성했습니다.​에이전트인력관리이플랫폼은다섯가지핵심기능을포함합니다:모든에이전트를추적하는레지스트리,MicrosoftEntra를통한고유에이전트ID로접근제어,에이전트와데이터간의연결을보여주는시각화대시보드,Microsoft365앱과의상호운용성,그리고MicrosoftDefender와Purview를통한보안보호.​"신규직원이나계약직근로자에게신원을제공하는것과같은방식으로,에이전트에게도신원과접근제어를제공하게될것입니다"라고Microsoft상업사업부의CEO인JudsonAlthoff가CNBC에말했습니다.​Agent365는Microsoft의CopilotStudio와Foundry로구축된에이전트뿐만아니라Adobe,ServiceNow,Workday와같은파트너및Genspark과같은신흥스타트업의에이전트도지원합니다.전MicrosoftBing팀멤버인EricJing이설립한이스타트업은2025년4월SuperAgent플랫폼출시후5개월만에연간반복수익5천만달러를달성했습니다.​기업도입시작세계최대회계법인중하나인EY는이미AI에이전트의내부카탈로그를구축했지만,현재는더나은감독을얻기위해Agent365를구현하고있다고회사의전무이사인MarkLuquire가밝혔다.​Agent365는Microsoft365Copilot라이선스를보유한고객에게AI혁신에대한조기액세스를제공하는Microsoft의Frontier프로그램을통해이용할수있다.이플랫폼은IT팀이새로운에이전트를승인하고,사용량을모니터링하며,보안위협을식별하고,조직정책을준수하지않는에이전트를비활성화할수있도록한다.​Microsoft의비즈니스앱및에이전트부문사장인CharlesLamanna는이플랫폼이"조직이에이전트를구축하고,보안을유지하며,확장하는방식에있어새로운장을여는것"이라고말했다.
762 조회
0 추천
2025.11.19 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입