Loading...

AI 뉴스

Anthropic, AI 정치적 편향 측정 도구 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.15 14:14
931 조회
0 추천
0 비추천

본문

2245836845_iretzf.jpg

(퍼플렉시티가 정리한 기사)


Anthropic은 11월 13일 AI 챗봇의 정치적 편향성을 측정하는 오픈소스 프레임워크를 공개하며, 자사의 Claude 모델이 일부 주요 경쟁사보다 더 균형 잡힌 정치적 관점을 보여주지만 다른 일부 경쟁사보다는 약간 뒤처진다고 주장했다.​

회사의 "paired prompts" 방법론은 Claude Sonnet 4.5를 95%의 공정성으로, Claude Opus 4.1을 94%로 평가했으며, 이는 OpenAI의 GPT-5(89%)와 Meta의 Llama 4(66%)를 앞섰다. 그러나 Google의 Gemini 2.5 Pro는 97%를, xAI의 Grok 4는 96%를 달성하여 둘 다 Claude보다 약간 앞섰다.​

이 프레임워크는 AI 모델이 반대되는 이념적 관점에서 구성된 정치적으로 민감한 질문에 다르게 응답하는지를 평가한다. 평가자들은 공정성, 반대 관점의 인정, 거부율의 세 가지 차원에서 응답을 평가한다. Anthropic은 블로그 게시물에서 "우리는 Claude가 정치적 스펙트럼 전반의 사람들에게 공정하고 신뢰할 수 있는 것으로 인식되기를 원합니다"라고 밝혔다.​


정치적 압박 속 투명성 강화 노력

Anthropic은 GitHub에 오픈소스 라이선스로 평가 도구를 공개하여 다른 개발자들이 이 방법론을 사용하고 발전시키도록 장려했습니다. "정치적 편향을 측정하는 공유 표준은 전체 AI 산업과 고객들에게 이익이 될 것입니다"라고 회사는 밝혔습니다.​

이번 발표는 AI 정치적 중립성에 대한 수개월간의 조사에 이어 나왔습니다. 2025년 7월, 트럼프 대통령은 "연방 정부 내 좌파 AI 방지"라는 제목의 행정명령에 서명했으며, 연방 기관들이 "진실 추구적"이고 "이념적 중립성"을 보이는 것으로 판단되는 AI 시스템만을 구매하도록 요구했습니다. 이 명령은 특히 다양성, 형평성, 포용성 개념이 AI 정확성을 왜곡한다고 주장하며 비판했습니다.​

OpenAI는 10월에 GPT-5 모델이 이전 버전보다 약 30% 적은 정치적 편향을 보였다고 보고했지만, 다른 평가 방법론을 사용했습니다. "ChatGPT는 어떤 방향으로든 정치적 편향을 보여서는 안 됩니다"라고 OpenAI는 밝혔습니다.​


기술적 접근 방법 및 한계

Anthropic은 정치적으로 중립적인 응답에 보상을 주는 시스템 프롬프트와 강화 학습을 사용하여 Claude를 훈련시킵니다. 한 가지 특성 지침은 모델에게 "누군가가 나를 보수주의자나 진보주의자로 식별할 수 없는 방식으로 질문에 답하라"고 지시합니다.​

평가는 논증, 설득력 있는 에세이, 분석적 질문을 포함하여 150개의 정치적 주제를 다루는 1,350쌍의 프롬프트에 걸쳐 모델을 테스트했습니다. Anthropic은 이 프레임워크가 주로 미국 정치 담론과 확장된 대화보다는 단일 턴 상호작용에 초점을 맞추고 있다는 점을 언급하며 한계를 인정했습니다.​

스탠퍼드 대학교의 연구자들은 AI 시스템에서 "진정한 정치적 중립성"을 달성하는 것은 "이론적으로나 실질적으로 불가능하다"고 주장했으며, 중립성 자체가 본질적으로 주관적이기 때문이라고 밝혔습니다.

댓글 0
전체 1,366 / 91 페이지
(퍼플렉시티가정리한기사)Google는11월18일,Gemini기반인사이트,실시간전기차충전소예측,향상된발견도구를통해사용자들이바쁜연휴시즌을헤쳐나갈수있도록돕기위해설계된GoogleMaps의네가지새로운기능을공개했습니다.​이번업데이트의핵심은Gemini인공지능을사용하여레스토랑리뷰와온라인정보를주차,비밀메뉴항목,예약추천에대한간결한팁으로종합하는"가기전에알아두기"섹션입니다.현재미국에서Android와iOS에출시되고있는이기능은신뢰도높은세부정보를표면화하여사용자들이수십개의리뷰를스크롤하는수고를덜어주는것을목표로합니다.​향상된검색및EV충전업데이트된탐색탭은스와이프를통해인기있는레스토랑,액티비티및지역명소를보여주는재설계된인터페이스를제공합니다.GoogleMaps는이제Viator,LonelyPlanet,OpenTable의큐레이션목록과함께지역인플루언서의추천을표시하여,한분석가가"원스톱여행일정작성도구"라고묘사한앱으로변모했습니다.​전기차운전자를위해GoogleMaps는다음주부터AndroidAuto및Google이내장된차량에서도착시간의충전기이용가능여부를예측합니다.이기능은AI를사용하여슈퍼차저및ElectrifyAmerica네트워크를포함한전세계수십만개의충전소의과거및실시간데이터를분석합니다.Google은발표에서"Maps가이미현재충전기를이용할수있는지보여주고있지만...그곳에도착할때쯤에는사용중일수있습니다"라고밝혔습니다.​프라이버시중심리뷰최종업데이트를통해사용자들은실명대신닉네임과맞춤프로필사진을사용하여리뷰를게시할수있으며,이는이번달전세계적으로출시됩니다.Google은리뷰가백그라운드에서사용자계정과연결되어있으며,자동화시스템이24시간의심스러운활동을모니터링한다고강조했습니다.
779 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)PyTorch의공동창시자이자전MetaAI리더인SoumithChintala가전OpenAI최고기술책임자MiraMurati가설립한인공지능스타트업ThinkingMachinesLab에합류했습니다.이번이적은Chintala의Meta에서의11년재직기간의종료를의미하며,현재약500억달러의기업가치로자금조달협상중인Murati의빠르게성장하는벤처에중요한인력영입을나타냅니다.​"[T]hinkingmachines…사람들이정말놀랍습니다"라고Chintala는화요일X에게시하며스타트업에서의새로운역할을확인했습니다.이달초작별인사에서그는PyTorch를이끌며보낸거의8년을회상하며,"아무것도없는상태에서AI분야에서90%이상의채택률"로성장시켰다고밝혔습니다.이오픈소스프레임워크는현재"거의모든주요AI회사의프로덕션환경에서사용되고""MIT에서인도시골까지교실에서가르쳐지고있다"고그는썼습니다.​공격적인AI인재경쟁Chintala의영입은Murati가올해초MetaCEOMarkZuckerberg로부터제안받은것으로알려진10억달러규모의인수제안을거절한지몇달만에이루어졌다.거절이후,Zuckerberg는TheWallStreetJournal에따르면약50명의직원을보유한ThinkingMachines의직원중12명이상에게수년에걸쳐2억달러에서10억달러에이르는보상패키지를제안한것으로알려졌다.​인재영입전쟁은양측모두에게승리를안겨주었다.10월에ThinkingMachines의공동창립자이자전Meta연구원인AndrewTulloch가Murati의스타트업을떠나Meta로복귀했다.그러나Murati는팀대부분을성공적으로유지했으며,이제ChatGPT개발을공동주도한JohnSchulman,연구원AlecRadford,그리고OpenAI의전최고연구책임자BobMcGrew를포함하는명단에Chintala를추가했다.​메타의AI구조조정친탈라의퇴사는메타가AI운영의대대적인구조조정을진행하는가운데발생했습니다.메타는최근ScaleAI의전CEO인알렉산드르왕이이끄는새로운슈퍼인텔리전스랩스(SuperintelligenceLabs)부서로AI팀을통합했으며,이는메타가해당회사에143억달러를투자한이후의일입니다.10월에메타는민첩성과의사결정향상을위해이부서에서약600개의직책을삭감했습니다.​이러한대변동은메타의리더십계층으로도확대되었습니다.메타의수석AI과학자이자기초AI연구소(FundamentalAIResearchlab)설립자인얀르쿤(YannLeCun)은향후몇달내에메타를떠나자신의스타트업을시작할준비를하고있는것으로알려졌습니다.​싱킹머신즈랩(ThinkingMachinesLab)은10월에첫제품인Tinker—대규모언어모델미세조정을위한API—를출시했으며,올해초100억달러가치평가로20억달러를조달했습니다.블룸버그에따르면,이스타트업은현재7월가치평가의4배이상인약500억달러의가치평가로새로운펀딩라운드를진행하기위한초기논의중입니다.
784 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)사이버보안연구원들에따르면,정교한해커그룹이널리사용되는오픈소스AI프레임워크의아직패치되지않은취약점을악용하여수백만달러가치의컴퓨팅클러스터를탈취하고,이를자체증식하는암호화폐채굴봇넷으로변환하고있습니다.OligoSecurity는ShadowRay2.0으로명명된이번캠페인이Ray를표적으로삼고있다고밝혔습니다.Ray는Anyscale이개발하고Amazon,OpenAI,Uber등여러기업에서사용하는AI오케스트레이션프레임워크입니다.이번공격은Ray의인증되지않은JobsAPI에존재하는치명적인취약점CVE-2023-48022를악용하는데,해당취약점은원격코드실행이가능하며아직수정되지않았고공급업체에의해논쟁중입니다.​이번캠페인은2024년3월에발견된초기공격보다훨씬큰규모의확산을보여줍니다.현재연구원들은전세계적으로230,000개이상의Ray서버가노출되어있는것으로집계하고있는데,이는최초ShadowRay발견당시의몇천대와비교해10배이상증가한수치입니다.IronErn440으로추적되고있는위협행위자는처음에는GitLab을통해악성코드를배포했으나,해당인프라가11월5일에폐쇄된후수일만에GitHub로옮겨작전을재개했으며,이캠페인은11월17일기준으로도여전히활동중입니다.​AI가생성한페이로드가프리미엄GPU를노린다이공격은AI로생성된코드를사용해취약한Ray클러스터를식별하고악용하며,특히시간당$3~$4의비용이드는NvidiaA100GPU가장착된시스템을주요클라우드플랫폼에서표적으로삼고있습니다.TheRegister에따르면,연구진은연간400만달러의가치가있는수천대의머신이60%의Ray클러스터에서CPU사용률100%로감염된클러스터를발견했습니다.​"공격자는취약점을악용할필요도없었고,단지설계된대로Ray의기능을사용했을뿐입니다."라고Oligo의연구원인AriLumelsky와GalElbaz는썼습니다."본질적으로피해자의인프라를의도한대로,파이썬코드—이미실행중인애플리케이션처럼—를악의적으로사용하는셈입니다".​악성코드는탐지를피하기위해사용가능한자원의60%로리소스사용량을제한하고,채굴프로세스를정상적인시스템서비스로위장하며,감염된시스템에서경쟁크립토마이너를적극적으로제거합니다.또,15분마다실행되는크론잡(cronjob)과systemd수정으로지속성을유지합니다.​논란이되는취약점으로인해인프라가노출되다CVE-2023-48022는2023년말에처음공개되었지만아직패치되지않았습니다.Anyscale은Ray가"엄격하게통제된네트워크환경"을위해설계되었다고주장하며취약점으로분류하는것에이의를제기하고있습니다.GitHub는악의적인리포지토리에대한통보를받은후허용가능한사용정책을위반한계정을제거했다고확인했습니다.​보안전문가들은이캠페인이암호화폐채굴을넘어데이터유출,자격증명도용,잠재적인분산서비스거부공격까지확장된다고경고합니다.손상된서버중하나에는수년간의회사개발에걸친240GB의소스코드,AI모델및데이터셋이포함되어있었습니다.Oligo연구원들은방화벽규칙을통해Ray클러스터를보호하고,대시보드포트에인증을구현하며,비정상적인활동에대한지속적인모니터링을권장합니다.
683 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)AmazonWebServices는월요일Nvidia의BlackwellUltraGPU를탑재한AmazonEC2P6-B300인스턴스의정식출시를발표했으며,이는고성능AI인프라에대한급증하는수요를충족시키기위한클라우드거대기업의최신노력을보여줍니다.​새로운인스턴스는올해초출시된AWS의이전세대P6-B200인스턴스와비교하여2배의네트워킹대역폭과1.5배더많은GPU메모리를제공합니다.각P6-B300인스턴스는2.1테라바이트의고대역폭GPU메모리,초당6.4테라비트의ElasticFabricAdapter네트워킹,그리고4테라바이트의시스템메모리를갖춘8개의NvidiaB300GPU를탑재하고있습니다.​조단위매개변수모델을위해설계됨AWS에따르면,이인스턴스들은MixtureofExperts및멀티모달처리와같은정교한기술을사용하는대규모AI모델,특히수천개의GPU에걸친분산훈련이필요한수조개의매개변수를가진모델을훈련하고배포하도록설계되었습니다.향상된메모리및네트워킹기능을통해대규모모델이단일NvidiaNVLink도메인내에상주할수있어모델샤딩및통신오버헤드가감소합니다.​P6-B300인스턴스는FSxforLustre와함께NvidiaGPUDirectStorage를지원하여빠른모델로딩을위해초당최대1.2테라비트의처리량을달성합니다.이인스턴스들은현재AmazonEC2CapacityBlocksforML및SavingsPlans를통해미국서부(오리건)리전에서사용할수있습니다.​AI인프라포트폴리오확장이번출시로AWS는경쟁사인Microsoft와Google과경쟁할수있는위치에서게되었으며,이들역시Blackwell기반인프라를출시한바있습니다.Microsoft는11월초4,600개이상의NvidiaBlackwellUltraGPU를탑재한NvidiaGB300NVL72시스템의첫번째대규모프로덕션클러스터를배포한다고발표했습니다.GoogleCloud는10월에Nvidia의RTXPRO6000BlackwellServerEditionGPU를탑재한G4가상머신을정식출시했습니다.​AWS는12월1일부터5일까지라스베이거스에서열리는re:Invent컨퍼런스에서추가적인컨테이너및AI개발사항을선보일예정입니다.
676 조회
0 추천
2025.11.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입