AI 뉴스

Anthropic, AI 정치적 편향 측정 도구 출시

페이지 정보

작성자 xtalfi
작성일 11.15 14:14
37 조회
0 추천
0 비추천

본문

2245836845_iretzf.jpg

(퍼플렉시티가 정리한 기사)


Anthropic은 11월 13일 AI 챗봇의 정치적 편향성을 측정하는 오픈소스 프레임워크를 공개하며, 자사의 Claude 모델이 일부 주요 경쟁사보다 더 균형 잡힌 정치적 관점을 보여주지만 다른 일부 경쟁사보다는 약간 뒤처진다고 주장했다.​

회사의 "paired prompts" 방법론은 Claude Sonnet 4.5를 95%의 공정성으로, Claude Opus 4.1을 94%로 평가했으며, 이는 OpenAI의 GPT-5(89%)와 Meta의 Llama 4(66%)를 앞섰다. 그러나 Google의 Gemini 2.5 Pro는 97%를, xAI의 Grok 4는 96%를 달성하여 둘 다 Claude보다 약간 앞섰다.​

이 프레임워크는 AI 모델이 반대되는 이념적 관점에서 구성된 정치적으로 민감한 질문에 다르게 응답하는지를 평가한다. 평가자들은 공정성, 반대 관점의 인정, 거부율의 세 가지 차원에서 응답을 평가한다. Anthropic은 블로그 게시물에서 "우리는 Claude가 정치적 스펙트럼 전반의 사람들에게 공정하고 신뢰할 수 있는 것으로 인식되기를 원합니다"라고 밝혔다.​


정치적 압박 속 투명성 강화 노력

Anthropic은 GitHub에 오픈소스 라이선스로 평가 도구를 공개하여 다른 개발자들이 이 방법론을 사용하고 발전시키도록 장려했습니다. "정치적 편향을 측정하는 공유 표준은 전체 AI 산업과 고객들에게 이익이 될 것입니다"라고 회사는 밝혔습니다.​

이번 발표는 AI 정치적 중립성에 대한 수개월간의 조사에 이어 나왔습니다. 2025년 7월, 트럼프 대통령은 "연방 정부 내 좌파 AI 방지"라는 제목의 행정명령에 서명했으며, 연방 기관들이 "진실 추구적"이고 "이념적 중립성"을 보이는 것으로 판단되는 AI 시스템만을 구매하도록 요구했습니다. 이 명령은 특히 다양성, 형평성, 포용성 개념이 AI 정확성을 왜곡한다고 주장하며 비판했습니다.​

OpenAI는 10월에 GPT-5 모델이 이전 버전보다 약 30% 적은 정치적 편향을 보였다고 보고했지만, 다른 평가 방법론을 사용했습니다. "ChatGPT는 어떤 방향으로든 정치적 편향을 보여서는 안 됩니다"라고 OpenAI는 밝혔습니다.​


기술적 접근 방법 및 한계

Anthropic은 정치적으로 중립적인 응답에 보상을 주는 시스템 프롬프트와 강화 학습을 사용하여 Claude를 훈련시킵니다. 한 가지 특성 지침은 모델에게 "누군가가 나를 보수주의자나 진보주의자로 식별할 수 없는 방식으로 질문에 답하라"고 지시합니다.​

평가는 논증, 설득력 있는 에세이, 분석적 질문을 포함하여 150개의 정치적 주제를 다루는 1,350쌍의 프롬프트에 걸쳐 모델을 테스트했습니다. Anthropic은 이 프레임워크가 주로 미국 정치 담론과 확장된 대화보다는 단일 턴 상호작용에 초점을 맞추고 있다는 점을 언급하며 한계를 인정했습니다.​

스탠퍼드 대학교의 연구자들은 AI 시스템에서 "진정한 정치적 중립성"을 달성하는 것은 "이론적으로나 실질적으로 불가능하다"고 주장했으며, 중립성 자체가 본질적으로 주관적이기 때문이라고 밝혔습니다.

댓글 0
전체 1,117 / 44 페이지
(퍼플렉시티가정리한기사)인공지능(AI)이심혈관임상시험에서임상사건을전문의수준의정확도로성공적으로판정함으로써,신약개발의비용과복잡성을줄일수있는잠재적전환점을맞고있습니다.연구진은이번주시카고에서열린2025년미국심장협회(AmericanHeartAssociation)연례학술대회에서,AI모델이인간임상사건위원회와동등하게심근경색,뇌졸중,심혈관사망을판별할수있음을발표했습니다.​이번돌파구의중심에는대형언어모델(LargeLanguageModels)과자연어처리(NaturalLanguageProcessing)를활용한두가지첨단AI시스템이있습니다.Auto-MACE모델은PARADISE-MI임상시험에참가한5,661명을대상으로심혈관사망에대해97%,심근경색89%,뇌졸중88%의임상사건위원회와의일치도를보였습니다.한편,심부전자연어처리(HeartFailureNaturalLanguageProcessing)모델은글로벌DELIVER임상시험에서임상의와83%의전체일치도,특히심부전입원판별에서87%의일치도를기록했습니다.​비용이많이드는프로세스간소화임상사건판정은임상시험중특정의료사건이실제로발생했는지확인하는과정으로,일반적으로전문의사패널이의료기록을수작업으로검토해야합니다.이노동집약적인과정은주요비용발생원인으로작용하며,심혈관약물의규제승인임상시험참가자1인당비용이$35,000을초과하기도합니다.​"AI가사람이직접검토해야하는사례의양을줄임으로써,판정비용과일정지연의주요원인을줄일수있습니다."라고브리검여성병원(PabloM.Marti-Castellote외연구진)이그들의JACC논문에서밝혔습니다.Auto-MACE모델은사망사례의69%와잠재적뇌졸중의81%를자신있게판정했으며,불확실한사례에대해서만인간의검토가필요했습니다.​업계영향화이자,존슨앤드존슨,노바티스등제약사들은개발기간과비용감소의수혜를받을것으로보입니다.IQVIA와같은계약연구기관들은이미AI솔루션을도입하고있으며,한설문조사에따르면타당성평가에소요되는시간이90%까지줄었다고합니다.​최근업계분석에따르면,임상시험에AI를통합하면시험당최대70%의비용절감과80%의기간단축이가능하다고합니다.2030년까지AI가임상시험의60~70%에통합될것으로예상되며,이는제약업계에연간200~300억달러의비용절감효과를가져올수있습니다.​마이크로소프트와IBM등테크기업들은임상시험관리를위한AI-서비스형플랫폼개발에유리한위치에있습니다.심혈관연구재단의알렉산드라포프마는Auto-MACE의결과를"환상적"이라며,이는"AI를임상시험의일부로공식적으로도입하는과정의중요한단계"라고평가했습니다.
40 조회
0 추천
11.15 등록
(퍼플렉시티가정리한기사)이번주주요엔터프라이즈소프트웨어공급업체들의일련의발표는에이전틱AI(지속적인인간감독없이의사결정을내리고행동을취할수있는자율시스템)가파일럿프로젝트에서프로덕션준비플랫폼으로이동했음을알리는신호입니다.11월13-14일,Cisco,Salesforce,NTTDATA를포함한기업들이상당한비용절감과효율성향상을약속하는이니셔티브를공개했습니다.Cisco는AICanvas플랫폼을강화하기위해소형언어모델을전문으로하는시애틀기반스타트업NeuralFabric을인수하겠다는의사를발표했습니다.회사에따르면,NeuralFabric의기술은조직이일반적인대형모델을배포하는것보다"90-99%저렴한"도메인별AI모델을구축할수있게합니다.2026년1월말까지완료될것으로예상되는이번인수는기업들이독점정보의보안을보장하면서공개데이터셋과비공개데이터를결합할수있도록함으로써데이터주권문제를해결합니다.​NTTDATA는11월14일ISGProviderLens에의해에이전틱AI서비스와생성형AI서비스부문모두에서리더로선정되었으며,이는생성형AI카테고리에서2년연속최고인정을받은것입니다.ISG보고서에따르면,회사의SmartAIAgentEcosystem은"30-50%의효율성향상,다운타임감소,고객만족도개선"을제공합니다.이생태계는인프라,오케스트레이션,개발및관찰성을아우르며,프로코드와로우코드개발을모두지원합니다.​조직변화가중심무대에오르다Kyndryl은11월13일인력전환과조직변화관리에초점을맞춘새로운자문서비스를출시했습니다.이회사의에이전틱AI프레임워크는중요한격차를해소합니다:Kyndryl의2025준비현황보고서에따르면,리더의87%가AI가1년내에일자리를재편할것으로예상하지만,인력이준비되어있다고답한비율은29%에불과합니다.​로우코드플랫폼도에이전틱기능을내장하고있습니다.Mendix는AgentsKit과AgentBuilder를도입했고,Appian은대규모에이전트배포를위한AgentStudio를발표했습니다.Deltek은"에이전틱재무마감"기능을포함하여ERP및프로젝트관리시스템전반에걸친에이전틱오케스트레이션을공개했으며,Pipefy는지능형문서처리기능을갖춘Agents2.0을출시했습니다.​데이터보호에멀티에이전트지원추가Druva는AmazonWebServices와파트너십을맺고11월14일데이터보호를위한멀티에이전트코파일럿에대해상세히발표했다.AmazonBedrockAgentCore로구축된이시스템은데이터검색,헬프데스크기능,백업작업시작과같은중요한작업을처리하는특화된에이전트들을특징으로한다.코파일럿은테스트중API선택에서91-93%의정확도를달성했으며,금융서비스사용사례에서조사시간을몇시간에서몇분으로단축했다.​글로벌에이전틱AI시장이2025년72억9천만달러에서2032년883억5천만달러로성장할것으로예상됨에따라이러한발표들이잇따르고있다.
38 조회
0 추천
11.15 등록
(퍼플렉시티가정리한기사)구글은Gemini앱에새로운기능을도입한다고목요일에발표했다.이기능은사용자가최대세개의참조이미지를업로드하여AI기반영상생성에활용할수있도록한다.구글이"비주얼인그리디언트"라고부르는이업데이트는복잡한텍스트프롬프트를작성하지않아도일관된캐릭터,스타일,그리고장면을가진영상을만들수있게해준다.​이기능은구글의최신영상생성모델인Veo3.1을활용하며,기존Flow영상편집도구와함께Gemini앱에서바로사용할수있다.9to5Google에따르면,해당업데이트는목요일부터점진적으로배포되고있으며,다음주에GoogleAIPlus,Pro,Ultra구독자에게전체제공될전망이다.​비디오제작간소화시각적요소기능은세가지주요창작과제를해결합니다:다양한장면에서캐릭터일관성유지,특정질감과예술적스타일을비디오로전환,그리고사용자의맞춤제작세계와객체일치보장.Google은이기능을AI비디오생성에전통적으로필요했던길고복잡한텍스트프롬프트에대한의존도를줄이는방법으로포지셔닝하고있습니다.​참조이미지는캐릭터,객체,스타일또는장면을묘사할수있으며,Veo3.1은사용자의텍스트지침에따라이를생성된비디오에통합합니다.이접근방식은5월출시이후2억7,500만개이상의비디오를제작하는데사용된Google의전용AI영화제작도구인Flow에서이미사용가능한기능을반영합니다.​10월중순에출시된Veo3.1은이전버전에비해더풍부한오디오생성,더강력한프롬프트준수,그리고더나은이미지-비디오변환품질을포함한여러개선사항을제공합니다.이모델은이제비디오와함께동기화된오디오를생성할수있으며여러샷에걸쳐캐릭터일관성을유지하기위해참조이미지를지원합니다.​구독및경쟁시각적재료기능은구글의AI플러스,프로,울트라요금제가입자들에게제공될예정입니다.구글AI프로는월20달러이며,울트라는월249.99달러이고가장높은사용한도와Veo3에대한접근권한이포함되어있습니다.회사의Gemini앱은최근월간활성사용자수가6억5천만명을돌파했으며,이는3월의3억5천만명에서증가한수치입니다.​이번업데이트는구글이AI영상생성분야에서점점치열해지는경쟁에직면한가운데이루어진것입니다.최근오픈AI가Sora2를출시했고,메타는MovieGen도구를개발중입니다.구글또한최근100만달러상금의AI영화대회를발표했으며,참가자는최소70%이상구글AI로생성한콘텐츠를사용해야합니다.
39 조회
0 추천
11.15 등록
(퍼플렉시티가정리한기사)일본의요양원에서중국의공장현장까지,글로벌노동력을근본적으로재편할수있는새로운세대의휴머노이드로봇이등장하고있습니다.업계전망에따르면금세기중반까지10억대이상의이러한기계들이작동하며빨래개기부터자동차조립까지다양한작업을수행할것으로예측됩니다.NvidiaCEO젠슨황이"물리적AI"라고부르는것을향한추진은이번주여러발전과함께가속화되었습니다.중국자동차제조업체XPeng은11월5일광저우에서열린행사에서IRON휴머노이드로봇을공개했으며,CEO허샤오펑은회의론자들이사람이내부에숨어있는지의문을제기할정도로생생한기계를시연했습니다.이회사는2026년말까지고급로봇의대량생산을달성하는것을목표로하고있습니다.​도쿄에서는24세의히로야마모토의스타트업Enactic이일본의인력부족요양시설에서설거지와빨래를할수있는휴머노이드로봇을개발하고있습니다.이회사의OpenArm훈련장치는이미Nvidia와스탠포드를포함한최고대학들에서사용되고있습니다.야마모토는내년여름부터"매우혼란스러운환경에서사람들과함께생활할수있는"새로운로봇을배치할계획입니다.​시장폭발적성장예상MorganStanley는휴머노이드로봇시장이2050년까지5조달러에이를것으로전망하며,하드웨어시장만으로도연간매출4.7조달러를기록할것으로예상합니다.이투자은행은그해까지전세계적으로10억개이상의휴머노이드가운용되어인도의생산가능인구에맞먹는노동력을창출할것으로예측합니다.​시장은점진적으로성장할것이며,2035년까지약1,300만대가예상되고대부분은공장과창고에배치될것입니다.가격은현재20만달러에서선진국에서는5만달러로,중국공급망이지배적인지역에서는1만5천달러까지급락할수있습니다.​업계통합이시작되다일본의소프트뱅크(SoftBankGroupCorp.)는10월8일ABB의로봇부문을54억달러에인수한다고발표하며업계의대대적인통합을알렸다.소프트뱅크창립자손마사요시는이번거래가"초지능인공지능과로봇기술을결합해혁명적인변화를촉진할것"이라고말했다.​한편,미국-노르웨이스타트업1X는10월28일NEO휴머노이드홈어시스턴트의사전주문을시작했으며,가격은2만달러로2026년부터배송이시작된다.하지만초기시연에서는기술이여전히장애물을겪고있는모습이드러났으며,영상에서는NEO가식기세척기문을닫는데어려움을겪는장면이공개되었다.​XPeng의허샤오펑은"당사로봇이자율적으로걷고춤을출수있지만,공장노동자를대체하기에는아직멀었다"며,"로봇팔하나의비용만해도중국노동자여러해치의임금을넘을수있다"고밝혔다.그럼에도충분한데이터와훈련이있다면,휴머노이드로봇이"거의모든인간의역할"을eventually수행할수있을것이라고믿고있다.​BostonDynamics와토요타리서치인스티튜트는지난8월Atlas휴머노이드가단일신경망을통해전체로봇을제어하는대규모행동모델(LargeBehaviorModel)을활용하여복잡한포장및분류작업을수행할수있음을시연했다.​런던대학교(UCL)로봇공학조교수사라아델라아바드구아만(SaraAdelaAbadGuaman)은"자연은우리에게환경에적응하려면올바른신체가필요함을보여주었다"며,로봇의인공지능시스템과실제신체능력사이에는"큰격차"가있다고지적했다.
42 조회
0 추천
11.15 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입