Loading...

AI 뉴스

Anthropic, AI 정치적 편향 측정 도구 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.15 14:14
944 조회
0 추천
0 비추천

본문

2245836845_iretzf.jpg

(퍼플렉시티가 정리한 기사)


Anthropic은 11월 13일 AI 챗봇의 정치적 편향성을 측정하는 오픈소스 프레임워크를 공개하며, 자사의 Claude 모델이 일부 주요 경쟁사보다 더 균형 잡힌 정치적 관점을 보여주지만 다른 일부 경쟁사보다는 약간 뒤처진다고 주장했다.​

회사의 "paired prompts" 방법론은 Claude Sonnet 4.5를 95%의 공정성으로, Claude Opus 4.1을 94%로 평가했으며, 이는 OpenAI의 GPT-5(89%)와 Meta의 Llama 4(66%)를 앞섰다. 그러나 Google의 Gemini 2.5 Pro는 97%를, xAI의 Grok 4는 96%를 달성하여 둘 다 Claude보다 약간 앞섰다.​

이 프레임워크는 AI 모델이 반대되는 이념적 관점에서 구성된 정치적으로 민감한 질문에 다르게 응답하는지를 평가한다. 평가자들은 공정성, 반대 관점의 인정, 거부율의 세 가지 차원에서 응답을 평가한다. Anthropic은 블로그 게시물에서 "우리는 Claude가 정치적 스펙트럼 전반의 사람들에게 공정하고 신뢰할 수 있는 것으로 인식되기를 원합니다"라고 밝혔다.​


정치적 압박 속 투명성 강화 노력

Anthropic은 GitHub에 오픈소스 라이선스로 평가 도구를 공개하여 다른 개발자들이 이 방법론을 사용하고 발전시키도록 장려했습니다. "정치적 편향을 측정하는 공유 표준은 전체 AI 산업과 고객들에게 이익이 될 것입니다"라고 회사는 밝혔습니다.​

이번 발표는 AI 정치적 중립성에 대한 수개월간의 조사에 이어 나왔습니다. 2025년 7월, 트럼프 대통령은 "연방 정부 내 좌파 AI 방지"라는 제목의 행정명령에 서명했으며, 연방 기관들이 "진실 추구적"이고 "이념적 중립성"을 보이는 것으로 판단되는 AI 시스템만을 구매하도록 요구했습니다. 이 명령은 특히 다양성, 형평성, 포용성 개념이 AI 정확성을 왜곡한다고 주장하며 비판했습니다.​

OpenAI는 10월에 GPT-5 모델이 이전 버전보다 약 30% 적은 정치적 편향을 보였다고 보고했지만, 다른 평가 방법론을 사용했습니다. "ChatGPT는 어떤 방향으로든 정치적 편향을 보여서는 안 됩니다"라고 OpenAI는 밝혔습니다.​


기술적 접근 방법 및 한계

Anthropic은 정치적으로 중립적인 응답에 보상을 주는 시스템 프롬프트와 강화 학습을 사용하여 Claude를 훈련시킵니다. 한 가지 특성 지침은 모델에게 "누군가가 나를 보수주의자나 진보주의자로 식별할 수 없는 방식으로 질문에 답하라"고 지시합니다.​

평가는 논증, 설득력 있는 에세이, 분석적 질문을 포함하여 150개의 정치적 주제를 다루는 1,350쌍의 프롬프트에 걸쳐 모델을 테스트했습니다. Anthropic은 이 프레임워크가 주로 미국 정치 담론과 확장된 대화보다는 단일 턴 상호작용에 초점을 맞추고 있다는 점을 언급하며 한계를 인정했습니다.​

스탠퍼드 대학교의 연구자들은 AI 시스템에서 "진정한 정치적 중립성"을 달성하는 것은 "이론적으로나 실질적으로 불가능하다"고 주장했으며, 중립성 자체가 본질적으로 주관적이기 때문이라고 밝혔습니다.

댓글 0
전체 1,366 / 129 페이지
(퍼플렉시티가정리한기사)여행계획을위한인공지능사용은지난1년간거의두배증가하여2024년10%에서2025년18%로상승했으며,젊은여행객들이채택을주도하고있고지리적패턴은기술에대한편안함수준에서뚜렷한차이를드러내고있다.​Z세대와밀레니얼세대가이러한변화를주도하고있으며,25세에서34세사이여행객의18%가여행조사를위해AI도구를사용하는반면,55세에서64세사이의경우단3%에불과하다.사용률은중국에서40%로가장높고,미국이27%로그뒤를잇고있어시장간디지털습관이극적으로다르다는것을보여준다.​Claude,최고의AI여행어시스턴트로부상다섯가지주요AI챗봇—ChatGPT,Gemini,Claude,Deepseek,MicrosoftCoPilot—에대한종합테스트결과,여행계획능력에서눈에띄는차이가드러났습니다.Claude는활동,식사,교통비를포함한여행의모든측면에대해상세한예산내역을제공하며두각을나타냈습니다.이챗봇은또한목적지와계절에맞춘짐싸기목록과함께어떤예약을가장미리해야하는지에대한예약팁을제공했습니다.​ChatGPT는각단계마다출처를인용한포괄적인일별여행일정을제공했으며,Gemini는스프레드시트를선호하는여행자를위해"시트로내보내기"기능과함께더깔끔한레이아웃을제공했습니다.MicrosoftCoPilot은각활동과식사에대해여러옵션을제공하는데뛰어났으며,Deepseek는예산을고려하는여행자를위해특정여행사추천과식료품점옵션을제공했습니다.​그러나모든플랫폼은항공편과휴가용렌탈숙소를찾는데한계를보였으며,이는여전히인간여행사와전통적인예약사이트가우위를유지하고있는영역입니다.​신뢰와우려가지속되다채택이증가하고있음에도불구하고,여행자들은AI기반여행계획에대해상당한우려를품고있습니다.33개시장에서37,000명이상의소비자를대상으로조사한Booking.com의글로벌AI감정보고서에따르면,47%는AI가고정관념이나차별을강화하는편향을도입할수있다고우려하고있습니다.또한38%는예산여행자들이이기술에의해우선순위에서밀릴수있다고믿고있습니다.​그러나열의는여전히높으며,89%의소비자가향후여행계획에AI를사용하는것에관심을표명했습니다.여행자의3분의2는AI가여행을더쉽고효율적으로만들것이라고믿으며,67%는이미여행계획이나여행중일부측면에서AI도구를사용했습니다.​이기술은주요여행플랫폼에빠르게통합되고있습니다.2025년10월,OpenAI는Expedia및Booking.com과의파트너십을특징으로하는앱을ChatGPT내에서출시하여,사용자들이챗봇을통해직접여행을검색하고예약할수있도록했습니다.Expedia는11월실적발표에서AI기반개인화및가상상담원이현재고객서비스문의의절반이상을해결하고있다고보고했습니다.​AI가여행산업을계속재편함에따라,기업들의과제는공정성과정확성에대한지속적인우려를해결하는동시에AI를필수적인계획도구로점점더인식하는세대의기대를충족시키기위해혁신과투명성의균형을맞추는것이될것입니다.
985 조회
0 추천
2025.11.14 등록
(퍼플렉시티가정리한기사)IBM은11월13일기업리더들이인공지능투자를우선시하고있지만,대부분의조직은자사의데이터인프라가AI기반매출성장을지원할수있다는확신이부족하다는연구결과를발표했다.​IBM비즈니스가치연구소(IBMInstituteforBusinessValue)가옥스퍼드이코노믹스(OxfordEconomics)와협력하여실시한이연구는2025년7월부터9월사이에27개국19개산업분야의최고데이터책임자(ChiefDataOfficers)1,700명을대상으로설문조사를진행했다.조사결과에따르면,CDO의81%는AI역량을가속화하는투자를우선시하고있으며,78%는독점데이터활용을최우선전략목표로꼽았다.그러나단26%만이자사의데이터가AI기반의새로운수익원을지원할수있다고확신하고있다.​IBM의부사장이자최고데이터책임자인에드러블리(EdLovely)는"대규모엔터프라이즈AI는손이닿는거리에있지만,성공은조직이올바른데이터로이를구동하는지에달려있다"고말했다."이를제대로수행하는조직은단순히AI를개선하는것을넘어,운영방식을혁신하고,더빠른의사결정을내리며,변화에더신속하게적응하고경쟁우위를확보하게될것이다."​증가하는인재위기이연구는자격을갖춘데이터전문가를확보하기위한경쟁이심화되고있음을강조합니다.CDO의거의절반인47%가현재고급데이터인재를유치하고,개발하며,유지하는것을최대과제로꼽고있으며,이는2023년32%에서증가한수치입니다.또한77%는핵심데이터역할을채우는데어려움을겪고있다고보고하는반면,채용노력이필요한기술과경험을제공한다고답한비율은53%에불과하며,이는2024년75%에서급격히감소한것입니다.​이연구는데이터접근성,완전성,무결성,정확성및일관성을조직이AI를위해기업데이터를완전히활용하는것을방해하는주요장벽으로식별합니다.이러한장애물에도불구하고,CDO의83%는AI에이전트배포의잠재적이익이위험보다크다고믿고있습니다.​도전과제속에서의전략적진전이연구는일부영역에서진전을보여줍니다.조사결과에따르면,CDO의81%가자신의조직의데이터전략이이제기술로드맵및인프라투자와통합되어있다고보고했으며,이는2023년52%에비해증가한수치입니다.또한84%는자신들의고유한데이터제품이이미경쟁우위를제공했다고말합니다.​이연구는또한CDO의92%가자신의역할에서성공하기위해서는비즈니스성과에집중해야한다고말한다는것을발견했습니다.그러나데이터가비즈니스결과를촉진하는방법을명확하게전달할수있다고강력히동의하는비율은3분의1에불과하며,데이터기반비즈니스성과의가치를결정할명확한측정기준을가진비율은단29%에불과합니다.
1057 조회
0 추천
2025.11.14 등록
(퍼플렉시티가정리한기사)AI안전회사Anthropic은화요일,자사의ClaudeAI모델이비전문가연구원들이사족보행로봇을프로그래밍하는데걸리는시간을인간만으로작업한경우의약절반으로단축하는데도움을주었다고밝혔으며,이는디지털세계와물리적세계를연결할수있는AI시스템을향한중요한진전을의미한다.​11월12일에발표된ProjectFetch라는실험에서,Anthropic은로봇공학전문지식이없는자사연구원8명을두팀으로나누어UnitreeGo2로봇개에게비치볼을자율적으로가져오도록프로그래밍하는과제를부여했다.Claude에접근할수있었던팀은AI지원없이작업한팀보다약절반의시간에과제를완료했다.​디지털과물리적세계의연결이연구는하드웨어연결과온보드센서접근이라는복잡한프로세스를간소화하는Claude의능력을입증했으며,AI지원팀이가장두드러진이점을보인영역이었다.Anthropic의레드팀소속LoganGraham은WIRED에"우리는AI모델의다음단계가세상으로뻗어나가더광범위하게세상에영향을미치기시작할것이라고의심하고있습니다"라고말했다."이를위해서는모델이로봇과더욱인터페이스해야할것입니다".​TeamClaude는$16,900짜리UnitreeGo2로봇을프로그래밍하여비치볼을자율적으로찾아탐색하는데성공했지만,하루동안의실험내에서최종회수작업을완료하지는못했다.반면TeamClaude-less는로봇과의기본적인연결조차구축하는데어려움을겪었으며자율볼회수를향한실질적인진전을전혀이루지못했다.​실험은또한흥미로운팀역학을드러냈다.Claude없이작업한연구원들은훨씬더많은부정적감정과혼란을표현한반면,AI지원팀은각구성원이자신의Claude인스턴스와협력하며대체로병렬적으로작업했다.그러나AI기반접근방식은때때로핵심목표에서주의를분산시키는탐색적"사이드퀘스트"로이어지기도했다.​안전우려증가이연구는AI제어로봇에대한우려가커지는가운데나왔다.이번주InternationalJournalofSocialRobots에게재된연구에따르면,OpenAI,Google,Meta의인기챗봇을구동하는AI모델들이로봇시나리오에서테스트했을때심각한피해를일으킬수있는명령을승인한것으로나타났다.​Anthropic은현재모델들이로봇을완전히자율적으로제어할만한지능은부족하지만,향후버전은그러한능력을갖출수있다고강조했다.회사의연구결과는모델이개선됨에따라"이전에알려지지않은하드웨어와상호작용하여물리적세계에영향을미치는능력이급격히발전할수있다"고시사한다.
990 조회
0 추천
2025.11.14 등록
(퍼플렉시티가정리한기사)MicrosoftCEO사티아나델라는회사가2030년까지반도체개발에OpenAI의맞춤형AI칩설계를통합할것이라고밝혔으며,이는두기술대기업간파트너십의전략적확장을의미합니다.이번주에공개된팟캐스트에서나델라는Microsoft가이제OpenAI의칩및하드웨어연구에접근할수있게되었으며,회사는이를대규모사용을위해"산업화"하고자체지적재산권하에확장할것이라고말했습니다.​나델라는"그들이시스템수준에서도혁신함에따라우리는그모든것에접근할수있습니다"라고말하며,Microsoft가먼저OpenAI의설계를구현한후이를더욱확장할것이라고설명했습니다.이협약은Microsoft에게2030년까지OpenAI의칩아키텍처,시스템설계및네트워킹하드웨어혁신에대한접근권한을부여하며,두회사의광범위한파트너십은2032년까지OpenAI의AI모델에대한Microsoft의권리를확장합니다.​OpenAI의칩개발추진OpenAI는Broadcom과맞춤형AI프로세서및네트워킹하드웨어를공동개발해왔으며,2026년하반기부터10기가와트의맞춤형칩을배포할계획입니다.OpenAI는자체칩을설계함으로써최첨단모델개발에서얻은통찰력을하드웨어에직접반영하여새로운기능을구현하는동시에NVIDIA와같은제3자공급업체에대한의존도를줄이는것을목표로하고있습니다.​Microsoft-OpenAI칩협력은두회사가10월에파트너십을재구성한후이루어졌으며,Microsoft는약1,350억달러가치로평가되는OpenAI의27%지분을확보했습니다.개정된계약에따라OpenAI는Azure서비스를추가로2,500억달러구매하기로약속했습니다.​페어워터데이터센터,AI야망에동력제공Microsoft의새로운Fairwater데이터센터는이러한칩혁신을배포하기위한기반역할을할것입니다.회사는10월에운영을시작한애틀랜타의두번째Fairwater시설을공개했으며,이는전용고속광섬유네트워크를통해위스콘신사이트와연결됩니다.이러한시설은"AI슈퍼팩토리"로기능하여여러사이트가함께작동하여몇달이아닌몇주만에모델을훈련할수있습니다.​각Fairwater데이터센터는수십만개의BlackwellGPU로확장할수있는NVIDIAGB200NVL72랙스케일시스템과거의제로에가까운물을소비하는고급액체냉각시스템을갖추고있습니다.Microsoft의클라우드및AI담당부사장인ScottGuthrie는"AI에서선도한다는것은단순히더많은GPU를추가하는것이아니라이들이하나의시스템으로함께작동하도록만드는인프라를구축하는것입니다"라고말했습니다.​
1047 조회
0 추천
2025.11.14 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입