Loading...

AI 뉴스

Anthropic, AI 정치적 편향 측정 도구 출시

페이지 정보

작성자 xtalfi
작성일 11.15 14:14
26 조회
0 추천
0 비추천

본문

2245836845_iretzf.jpg

(퍼플렉시티가 정리한 기사)


Anthropic은 11월 13일 AI 챗봇의 정치적 편향성을 측정하는 오픈소스 프레임워크를 공개하며, 자사의 Claude 모델이 일부 주요 경쟁사보다 더 균형 잡힌 정치적 관점을 보여주지만 다른 일부 경쟁사보다는 약간 뒤처진다고 주장했다.​

회사의 "paired prompts" 방법론은 Claude Sonnet 4.5를 95%의 공정성으로, Claude Opus 4.1을 94%로 평가했으며, 이는 OpenAI의 GPT-5(89%)와 Meta의 Llama 4(66%)를 앞섰다. 그러나 Google의 Gemini 2.5 Pro는 97%를, xAI의 Grok 4는 96%를 달성하여 둘 다 Claude보다 약간 앞섰다.​

이 프레임워크는 AI 모델이 반대되는 이념적 관점에서 구성된 정치적으로 민감한 질문에 다르게 응답하는지를 평가한다. 평가자들은 공정성, 반대 관점의 인정, 거부율의 세 가지 차원에서 응답을 평가한다. Anthropic은 블로그 게시물에서 "우리는 Claude가 정치적 스펙트럼 전반의 사람들에게 공정하고 신뢰할 수 있는 것으로 인식되기를 원합니다"라고 밝혔다.​


정치적 압박 속 투명성 강화 노력

Anthropic은 GitHub에 오픈소스 라이선스로 평가 도구를 공개하여 다른 개발자들이 이 방법론을 사용하고 발전시키도록 장려했습니다. "정치적 편향을 측정하는 공유 표준은 전체 AI 산업과 고객들에게 이익이 될 것입니다"라고 회사는 밝혔습니다.​

이번 발표는 AI 정치적 중립성에 대한 수개월간의 조사에 이어 나왔습니다. 2025년 7월, 트럼프 대통령은 "연방 정부 내 좌파 AI 방지"라는 제목의 행정명령에 서명했으며, 연방 기관들이 "진실 추구적"이고 "이념적 중립성"을 보이는 것으로 판단되는 AI 시스템만을 구매하도록 요구했습니다. 이 명령은 특히 다양성, 형평성, 포용성 개념이 AI 정확성을 왜곡한다고 주장하며 비판했습니다.​

OpenAI는 10월에 GPT-5 모델이 이전 버전보다 약 30% 적은 정치적 편향을 보였다고 보고했지만, 다른 평가 방법론을 사용했습니다. "ChatGPT는 어떤 방향으로든 정치적 편향을 보여서는 안 됩니다"라고 OpenAI는 밝혔습니다.​


기술적 접근 방법 및 한계

Anthropic은 정치적으로 중립적인 응답에 보상을 주는 시스템 프롬프트와 강화 학습을 사용하여 Claude를 훈련시킵니다. 한 가지 특성 지침은 모델에게 "누군가가 나를 보수주의자나 진보주의자로 식별할 수 없는 방식으로 질문에 답하라"고 지시합니다.​

평가는 논증, 설득력 있는 에세이, 분석적 질문을 포함하여 150개의 정치적 주제를 다루는 1,350쌍의 프롬프트에 걸쳐 모델을 테스트했습니다. Anthropic은 이 프레임워크가 주로 미국 정치 담론과 확장된 대화보다는 단일 턴 상호작용에 초점을 맞추고 있다는 점을 언급하며 한계를 인정했습니다.​

스탠퍼드 대학교의 연구자들은 AI 시스템에서 "진정한 정치적 중립성"을 달성하는 것은 "이론적으로나 실질적으로 불가능하다"고 주장했으며, 중립성 자체가 본질적으로 주관적이기 때문이라고 밝혔습니다.

댓글 0
전체 1,070 / 32 페이지
(퍼플렉시티가정리한기사)OpenAI는목요일인공지능이생물학적위협을만드는무기로전용되는것을방지하는데중점을둔스타트업인RedQueenBio에1,500만달러규모의시드라운드를주도할것이라고발표했으며,이는ChatGPT제작사의한달도안되는기간내두번째주요생물안보투자를의미한다.mRNA치료제회사인HelixNano에서분사한샌프란시스코소재이회사는잠재적인생물무기위협과같은속도로진화하는AI기반방어시스템개발을목표로하고있다.RedQueenBio는공동창립자HannuRajaniemi에따르면,생물학적시스템의취약점을식별하고대응책을설계하기위해컴퓨터모델과실험실테스트를결합할예정이다.​"생물학적역량이우리가예상했던것보다빠르게발전하고있다는것이명백했습니다"라고Rajaniemi는Reuters에말했다."우리는방어책개발을시작해야한다고느꼈습니다".​OpenAI의안전포트폴리오확장이번투자는OpenAI가지난10월뉴욕에본사를둔생물보안소프트웨어회사Valthos에3천만달러를투자한것에이어이루어졌다.OpenAI의최고전략책임자인JasonKwon은회사가유사한위험을다루는추가스타트업을지원하는데열려있다고말했다."우리는전체생태계의전반적인회복력을높이고싶습니다"라고Kwon은Reuters에말했다."위험완화를다룰수있는가장좋은방법중하나는더많은기술입니다".​이번펀딩라운드에는CerberusVentures,FiftyYears,HalcyonFutures도참여했다.거래의일환으로OpenAICEOSamAltman과이사회멤버NicoleSeligman은HelixNano에대한이전투자로인해RedQueenBio의주식을받게되지만,두사람모두이번거래승인에는참여하지않았다.OpenAI의최고컴플라이언스책임자와이해관계가없는이사회구성원들이이번투자를검토하고승인했다.​AI기반위협에맞서는경쟁레드퀸바이오는루이스캐럴의「거울나라의앨리스」에서이름을따왔으며,이는생물학적위협과방어역량간의끊임없는진화적경쟁을의미합니다.이스타트업의창립자들은오픈AI와의협업중최첨단AI모델들이놀라운생물학적창의성을보여주었으며,이는혁신적인치료법개발에활용될수있는가능성을갖는동시에,더어두운잠재력도내포하고있음을관찰했습니다.​안전전문가들은약물개발을가속화할수있는AI시스템이동시에악의적인행위자들이위험한병원체를설계하는장벽을낮출수있다고경고합니다.최근연구에서는합성단백질스크리닝과정에서의취약점이드러났고,여러AI연구소에서생물무기개발정보를제공할위험임계점에다다른모델들에대해우려를표명하고있습니다.​레드퀸바이오는선진AI모델,실험실자동화,강화학습을활용하여AI기반생물학적위협을맵핑하고미리의료대책을개발할계획입니다.이회사는퍼블릭베네핏코퍼레이션구조로설립되었으며,모든AI연구소,바이오제약회사,정부와협력할것을약속합니다.
28 조회
0 추천
11.15 등록
(퍼플렉시티가정리한기사)인공지능(AI)이심혈관임상시험에서임상사건을전문의수준의정확도로성공적으로판정함으로써,신약개발의비용과복잡성을줄일수있는잠재적전환점을맞고있습니다.연구진은이번주시카고에서열린2025년미국심장협회(AmericanHeartAssociation)연례학술대회에서,AI모델이인간임상사건위원회와동등하게심근경색,뇌졸중,심혈관사망을판별할수있음을발표했습니다.​이번돌파구의중심에는대형언어모델(LargeLanguageModels)과자연어처리(NaturalLanguageProcessing)를활용한두가지첨단AI시스템이있습니다.Auto-MACE모델은PARADISE-MI임상시험에참가한5,661명을대상으로심혈관사망에대해97%,심근경색89%,뇌졸중88%의임상사건위원회와의일치도를보였습니다.한편,심부전자연어처리(HeartFailureNaturalLanguageProcessing)모델은글로벌DELIVER임상시험에서임상의와83%의전체일치도,특히심부전입원판별에서87%의일치도를기록했습니다.​비용이많이드는프로세스간소화임상사건판정은임상시험중특정의료사건이실제로발생했는지확인하는과정으로,일반적으로전문의사패널이의료기록을수작업으로검토해야합니다.이노동집약적인과정은주요비용발생원인으로작용하며,심혈관약물의규제승인임상시험참가자1인당비용이$35,000을초과하기도합니다.​"AI가사람이직접검토해야하는사례의양을줄임으로써,판정비용과일정지연의주요원인을줄일수있습니다."라고브리검여성병원(PabloM.Marti-Castellote외연구진)이그들의JACC논문에서밝혔습니다.Auto-MACE모델은사망사례의69%와잠재적뇌졸중의81%를자신있게판정했으며,불확실한사례에대해서만인간의검토가필요했습니다.​업계영향화이자,존슨앤드존슨,노바티스등제약사들은개발기간과비용감소의수혜를받을것으로보입니다.IQVIA와같은계약연구기관들은이미AI솔루션을도입하고있으며,한설문조사에따르면타당성평가에소요되는시간이90%까지줄었다고합니다.​최근업계분석에따르면,임상시험에AI를통합하면시험당최대70%의비용절감과80%의기간단축이가능하다고합니다.2030년까지AI가임상시험의60~70%에통합될것으로예상되며,이는제약업계에연간200~300억달러의비용절감효과를가져올수있습니다.​마이크로소프트와IBM등테크기업들은임상시험관리를위한AI-서비스형플랫폼개발에유리한위치에있습니다.심혈관연구재단의알렉산드라포프마는Auto-MACE의결과를"환상적"이라며,이는"AI를임상시험의일부로공식적으로도입하는과정의중요한단계"라고평가했습니다.
27 조회
0 추천
11.15 등록
(퍼플렉시티가정리한기사)이번주주요엔터프라이즈소프트웨어공급업체들의일련의발표는에이전틱AI(지속적인인간감독없이의사결정을내리고행동을취할수있는자율시스템)가파일럿프로젝트에서프로덕션준비플랫폼으로이동했음을알리는신호입니다.11월13-14일,Cisco,Salesforce,NTTDATA를포함한기업들이상당한비용절감과효율성향상을약속하는이니셔티브를공개했습니다.Cisco는AICanvas플랫폼을강화하기위해소형언어모델을전문으로하는시애틀기반스타트업NeuralFabric을인수하겠다는의사를발표했습니다.회사에따르면,NeuralFabric의기술은조직이일반적인대형모델을배포하는것보다"90-99%저렴한"도메인별AI모델을구축할수있게합니다.2026년1월말까지완료될것으로예상되는이번인수는기업들이독점정보의보안을보장하면서공개데이터셋과비공개데이터를결합할수있도록함으로써데이터주권문제를해결합니다.​NTTDATA는11월14일ISGProviderLens에의해에이전틱AI서비스와생성형AI서비스부문모두에서리더로선정되었으며,이는생성형AI카테고리에서2년연속최고인정을받은것입니다.ISG보고서에따르면,회사의SmartAIAgentEcosystem은"30-50%의효율성향상,다운타임감소,고객만족도개선"을제공합니다.이생태계는인프라,오케스트레이션,개발및관찰성을아우르며,프로코드와로우코드개발을모두지원합니다.​조직변화가중심무대에오르다Kyndryl은11월13일인력전환과조직변화관리에초점을맞춘새로운자문서비스를출시했습니다.이회사의에이전틱AI프레임워크는중요한격차를해소합니다:Kyndryl의2025준비현황보고서에따르면,리더의87%가AI가1년내에일자리를재편할것으로예상하지만,인력이준비되어있다고답한비율은29%에불과합니다.​로우코드플랫폼도에이전틱기능을내장하고있습니다.Mendix는AgentsKit과AgentBuilder를도입했고,Appian은대규모에이전트배포를위한AgentStudio를발표했습니다.Deltek은"에이전틱재무마감"기능을포함하여ERP및프로젝트관리시스템전반에걸친에이전틱오케스트레이션을공개했으며,Pipefy는지능형문서처리기능을갖춘Agents2.0을출시했습니다.​데이터보호에멀티에이전트지원추가Druva는AmazonWebServices와파트너십을맺고11월14일데이터보호를위한멀티에이전트코파일럿에대해상세히발표했다.AmazonBedrockAgentCore로구축된이시스템은데이터검색,헬프데스크기능,백업작업시작과같은중요한작업을처리하는특화된에이전트들을특징으로한다.코파일럿은테스트중API선택에서91-93%의정확도를달성했으며,금융서비스사용사례에서조사시간을몇시간에서몇분으로단축했다.​글로벌에이전틱AI시장이2025년72억9천만달러에서2032년883억5천만달러로성장할것으로예상됨에따라이러한발표들이잇따르고있다.
26 조회
0 추천
11.15 등록
(퍼플렉시티가정리한기사)구글은Gemini앱에새로운기능을도입한다고목요일에발표했다.이기능은사용자가최대세개의참조이미지를업로드하여AI기반영상생성에활용할수있도록한다.구글이"비주얼인그리디언트"라고부르는이업데이트는복잡한텍스트프롬프트를작성하지않아도일관된캐릭터,스타일,그리고장면을가진영상을만들수있게해준다.​이기능은구글의최신영상생성모델인Veo3.1을활용하며,기존Flow영상편집도구와함께Gemini앱에서바로사용할수있다.9to5Google에따르면,해당업데이트는목요일부터점진적으로배포되고있으며,다음주에GoogleAIPlus,Pro,Ultra구독자에게전체제공될전망이다.​비디오제작간소화시각적요소기능은세가지주요창작과제를해결합니다:다양한장면에서캐릭터일관성유지,특정질감과예술적스타일을비디오로전환,그리고사용자의맞춤제작세계와객체일치보장.Google은이기능을AI비디오생성에전통적으로필요했던길고복잡한텍스트프롬프트에대한의존도를줄이는방법으로포지셔닝하고있습니다.​참조이미지는캐릭터,객체,스타일또는장면을묘사할수있으며,Veo3.1은사용자의텍스트지침에따라이를생성된비디오에통합합니다.이접근방식은5월출시이후2억7,500만개이상의비디오를제작하는데사용된Google의전용AI영화제작도구인Flow에서이미사용가능한기능을반영합니다.​10월중순에출시된Veo3.1은이전버전에비해더풍부한오디오생성,더강력한프롬프트준수,그리고더나은이미지-비디오변환품질을포함한여러개선사항을제공합니다.이모델은이제비디오와함께동기화된오디오를생성할수있으며여러샷에걸쳐캐릭터일관성을유지하기위해참조이미지를지원합니다.​구독및경쟁시각적재료기능은구글의AI플러스,프로,울트라요금제가입자들에게제공될예정입니다.구글AI프로는월20달러이며,울트라는월249.99달러이고가장높은사용한도와Veo3에대한접근권한이포함되어있습니다.회사의Gemini앱은최근월간활성사용자수가6억5천만명을돌파했으며,이는3월의3억5천만명에서증가한수치입니다.​이번업데이트는구글이AI영상생성분야에서점점치열해지는경쟁에직면한가운데이루어진것입니다.최근오픈AI가Sora2를출시했고,메타는MovieGen도구를개발중입니다.구글또한최근100만달러상금의AI영화대회를발표했으며,참가자는최소70%이상구글AI로생성한콘텐츠를사용해야합니다.
27 조회
0 추천
11.15 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입