AI 뉴스

Anthropic, AI 정치적 편향 측정 도구 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.15 14:14
1,080 조회
0 추천
0 비추천

본문

2245836845_iretzf.jpg

(퍼플렉시티가 정리한 기사)


Anthropic은 11월 13일 AI 챗봇의 정치적 편향성을 측정하는 오픈소스 프레임워크를 공개하며, 자사의 Claude 모델이 일부 주요 경쟁사보다 더 균형 잡힌 정치적 관점을 보여주지만 다른 일부 경쟁사보다는 약간 뒤처진다고 주장했다.​

회사의 "paired prompts" 방법론은 Claude Sonnet 4.5를 95%의 공정성으로, Claude Opus 4.1을 94%로 평가했으며, 이는 OpenAI의 GPT-5(89%)와 Meta의 Llama 4(66%)를 앞섰다. 그러나 Google의 Gemini 2.5 Pro는 97%를, xAI의 Grok 4는 96%를 달성하여 둘 다 Claude보다 약간 앞섰다.​

이 프레임워크는 AI 모델이 반대되는 이념적 관점에서 구성된 정치적으로 민감한 질문에 다르게 응답하는지를 평가한다. 평가자들은 공정성, 반대 관점의 인정, 거부율의 세 가지 차원에서 응답을 평가한다. Anthropic은 블로그 게시물에서 "우리는 Claude가 정치적 스펙트럼 전반의 사람들에게 공정하고 신뢰할 수 있는 것으로 인식되기를 원합니다"라고 밝혔다.​


정치적 압박 속 투명성 강화 노력

Anthropic은 GitHub에 오픈소스 라이선스로 평가 도구를 공개하여 다른 개발자들이 이 방법론을 사용하고 발전시키도록 장려했습니다. "정치적 편향을 측정하는 공유 표준은 전체 AI 산업과 고객들에게 이익이 될 것입니다"라고 회사는 밝혔습니다.​

이번 발표는 AI 정치적 중립성에 대한 수개월간의 조사에 이어 나왔습니다. 2025년 7월, 트럼프 대통령은 "연방 정부 내 좌파 AI 방지"라는 제목의 행정명령에 서명했으며, 연방 기관들이 "진실 추구적"이고 "이념적 중립성"을 보이는 것으로 판단되는 AI 시스템만을 구매하도록 요구했습니다. 이 명령은 특히 다양성, 형평성, 포용성 개념이 AI 정확성을 왜곡한다고 주장하며 비판했습니다.​

OpenAI는 10월에 GPT-5 모델이 이전 버전보다 약 30% 적은 정치적 편향을 보였다고 보고했지만, 다른 평가 방법론을 사용했습니다. "ChatGPT는 어떤 방향으로든 정치적 편향을 보여서는 안 됩니다"라고 OpenAI는 밝혔습니다.​


기술적 접근 방법 및 한계

Anthropic은 정치적으로 중립적인 응답에 보상을 주는 시스템 프롬프트와 강화 학습을 사용하여 Claude를 훈련시킵니다. 한 가지 특성 지침은 모델에게 "누군가가 나를 보수주의자나 진보주의자로 식별할 수 없는 방식으로 질문에 답하라"고 지시합니다.​

평가는 논증, 설득력 있는 에세이, 분석적 질문을 포함하여 150개의 정치적 주제를 다루는 1,350쌍의 프롬프트에 걸쳐 모델을 테스트했습니다. Anthropic은 이 프레임워크가 주로 미국 정치 담론과 확장된 대화보다는 단일 턴 상호작용에 초점을 맞추고 있다는 점을 언급하며 한계를 인정했습니다.​

스탠퍼드 대학교의 연구자들은 AI 시스템에서 "진정한 정치적 중립성"을 달성하는 것은 "이론적으로나 실질적으로 불가능하다"고 주장했으며, 중립성 자체가 본질적으로 주관적이기 때문이라고 밝혔습니다.

댓글 0
전체 1,366 / 162 페이지
(퍼플렉시티가정리한기사)찰스3세국왕은어제세인트제임스궁전에서열린퀸엘리자베스공학상시상식에서CEO젠슨황에게인공지능의위험성에대한강력한경고를직접전달했으며,이는이기술의급속한발전에대한왕실의우려가커지고있음을보여준다."그가말씀하시길,당신과이야기하고싶은것이있다고하셨어요.그리고저에게편지를건네주셨습니다"라고황은11월5일시상식이후BBC에말했다.그편지에는블레츨리파크에서열린AI안전정상회의에서국왕이2023년에한연설문사본이담겨있었으며,이연설에서AI위험은"긴급성,단합,그리고집단적힘의감각"으로대처해야한다고경고했다.​AI안전성에대한왕실의강조국왕의개입은엔비디아가지난주역사적인5조달러가치평가에도달하여이이정표를달성한최초의기업이되면서이루어졌다.국왕이황에게공유하기위해직접선택한2023년연설에서AI개발을"전기의발견못지않게중요하다"고규정하면서도이기술이"선과악을위해사용될수있다"고경고했다.​"그것은AI안전에관한그의연설이었습니다.그는분명히AI안전에대해매우깊이관심을가지고계십니다"라고황은말하며,영국과세계를변화시킬AI의"놀라운능력"에대한국왕의믿음을언급했다.행사중찰스국왕은참석자들에게"주변에많은악의적인행위자들이있다"고경고하며기술출현의"빠른"속도를지적했다.​저명한수상자들이우려를공유하다Huang은2025년QEPrize를수상한6명의다른AI선구자들과함께상을받았으며,여기에는GeoffreyHinton과YoshuaBengio가포함되어있는데,이들은모두이전에AI가인류에게실존적위협이된다고경고한바있다.50만파운드의상금은"현대머신러닝"에대한그들의집단적공헌을인정한것이다.​"AI의대모"로알려진Fei-FeiLi교수는기자들에게국왕과이기술이"사람들을위해좋은일을하고,우리가위험을인식하도록하는것"에대해논의했다고말했다.시상식은정책입안자들과업계리더들을분열시킨급속한AI발전과안전문제사이의긴장을부각시켰다.​정치적및산업적맥락영국국왕의AI주의강조는트럼프행정부의접근방식과극명하게대조됩니다.트럼프행정부는AI안전정상회의를AI행동정상회의로브랜드를변경하고안전조치보다신속한개발을장려해왔습니다.황대표는최근5,000억달러규모의AI칩주문을확보했으며미국정부를위한7개의새로운슈퍼컴퓨터계획을발표했습니다.​엔비디아를포함한미국의주요기술기업들은영국전역의AI인프라에수십억달러를계속투자하고있으며,황대표는현재순간을"지금바로일어나고있는산업혁명"이라고묘사했습니다.
1194 조회
0 추천
2025.11.06 등록
(퍼플렉시티가정리한기사)ktcloud가6일국내상업용데이터센터로는처음으로리퀴드쿨링(액체냉각)기술을적용한'가산AI데이터센터'를개소했다고발표했다.이는고성능GPU발열문제해결을통해AI인프라시장선점에나선전략적행보로평가된다.​가산AIDC는연면적약1만1046평,지하5층·지상10층규모로총수전용량40MW,IT용량26MW를갖춘초거대AI인프라허브다.특히GPU칩에콜드플레이트를부착하고냉수를직접접촉시키는D2C(DirecttoChip,직접칩냉각)방식을국내최초로상용화했다.​최지웅ktcloud대표는"GPU발열량이많아내구성이떨어질수밖에없다.수명이2~3년에불과해리퀴드쿨링은필수적"이라며"온도가낮춰져야오래쓸환경이마련된다"고강조했다.​AI전용서비스로시장공략가산AIDC를통해ktcloud는국내최초의'Colo.AI'서비스를본격제공한다.이는고객맞춤형GPU서버,전용네트워크,운영플랫폼,유지보수까지모든것을포함한통합형턴키AI인프라서비스다.엔비디아B200등최신GPU기반으로구성되며,랙당최대160kW급처리가가능해엔비디아블랙웰급GPU시스템도운영할수있다.​현재국내전문AI기업과중소금융기업등이이미Colo.AI를활용해대규모AI모델학습및서비스운영을수행하고있다.최대표는"온디맨드방식이어서초기투자부담이없고,데이터센터인프라와통신망을모두갖춰경쟁력이높다"고밝혔다.​AI인프라확장계획ktcloud는가산을시작으로서부권역을포함한국내주요거점에2030년까지500MW이상규모의인프라를중장기적으로확보할계획이다.이는엔비디아가한국에GPU26만장을공급하기로한가운데,AWS가7조원규모로국내AI데이터센터를확충하는등글로벌빅테크의한국투자가본격화되는시점과맞물려있다.
1197 조회
0 추천
2025.11.06 등록
(퍼플렉시티가정리한기사)Tenable의사이버보안연구원들은OpenAIChatGPT에서7개의치명적인취약점을공개했으며,이를통해공격자들이정교한프롬프트주입공격을통해사용자의개인정보를탈취할수있어,수억명의일일사용자들이자신도모르는사이에데이터도난에노출될가능성이있습니다.제로클릭공격이ChatGPT사용자를표적으로삼다GPT-4o와새로출시된GPT-5모델모두에영향을미치는이러한취약점은악의적인행위자가간접프롬프트주입기술을통해ChatGPT에간단한질문을하는것외에사용자의어떠한상호작용도필요없이채팅기록,개인메모리및민감한사용자데이터를유출할수있게합니다.​월요일에연구결과를발표한Tenable연구원MosheBernstein과LivMatan에따르면,"최신GPT-5모델에존재하는이러한취약점은공격자가단순히ChatGPT에질문을하는것을포함한여러가능성있는피해자사용사례를통해사용자도모르는사이에사용자를악용할수있게할수있습니다".​가장위험한공격벡터는공격자가Bing이나OpenAI의SearchGPT크롤러와같은검색엔진에색인되는악성웹사이트를만드는"제로클릭"취약점과관련이있습니다.사용자가검색을유발하는무해한질문을할때,ChatGPT는이러한손상된사이트에서숨겨진악성명령어를무의식적으로검색하고실행합니다.​메모리포이즈닝은지속적인공격을가능하게한다연구결과에따르면공격자들은ChatGPT의메모리기능을악용하여여러대화와세션에걸쳐지속되는데이터도용을생성할수있습니다."메모리주입"이라는기법을통해악의적인프롬프트가ChatGPT에게거짓정보를기억하도록하거나향후상호작용에서지속적으로개인데이터를유출하도록지시할수있습니다.​다른공격경로로는사용자가ChatGPT에게기사요약을요청할때실행되는악의적인명령을블로그댓글섹션에숨기는방법과,"chatgpt.com/?q={프롬프트}"형식의조작된URL을통해악의적인쿼리를자동으로실행하는원클릭취약점을악용하는방법이있습니다.​연구자들은또한ChatGPT의신뢰할수있는도메인화이트리스트를악용하는보안메커니즘우회방법을발견했으며,이를통해공격자들이Bing추적링크를사용하여악의적인URL을위장함으로써OpenAI의url_safe보호시스템을우회할수있습니다.​OpenAI,부분적인수정조치로대응OpenAI는Tenable에따르면기술연구권고(TRA-2025-22,TRA-2025-11,TRA-2025-06)를통해보고된취약점중일부를해결했습니다.그러나연구원들은여러개념증명공격이GPT-5에대해여전히효과적임을확인했으며,이는대규모언어모델에서프롬프트인젝션의지속적인과제를강조합니다.​"프롬프트인젝션은LLM이작동하는방식에서알려진문제이며,안타깝게도가까운미래에체계적으로수정되지않을것입니다"라고Tenable연구원들은경고했습니다.이러한발견은OpenAI가GPT-5의보안태세에대한지속적인조사에직면하고있는가운데나온것으로,별도의연구에서는이모델이엔터프라이즈테스트에서낮은보안점수를받았다고보여줍니다.​이러한취약점은기업들이ChatGPT및유사한도구를비즈니스워크플로우에점점더통합함에따라AI에이전트보안에대한광범위한우려를강조하며,잠재적으로민감한기업데이터를유사한공격벡터에노출시킬수있습니다.
1271 조회
0 추천
2025.11.06 등록
(퍼플렉시티가정리한기사)OpenAI는화요일에전세계적으로100만기업고객을돌파하여역사상가장빠르게성장하는비즈니스플랫폼으로자리매김했다고발표했습니다.이이정표는ChatGPTforWork를통하거나회사의개발자플랫폼을통한직접적인모델사용을통해비즈니스용도로적극적으로비용을지불하는모든조직을포함합니다.​이인공지능거대기업은현재매주8억명이상의사용자에게서비스를제공하고있으며,ChatGPTforWork좌석은단두달만에40%증가하여700만개에달했습니다.회사의발표에따르면ChatGPTEnterprise좌석은특히전년대비9배증가했습니다.​주요기업들이도입물결을주도하다여러산업분야의선도기업들이OpenAI의기술을핵심운영에통합하고있습니다.고객사로는Amgen,CommonwealthBank,Booking.com,Cisco,Lowe's,MorganStanley,T-Mobile,Target,그리고ThermoFisherScientific이포함됩니다.​매출기준미국최대건설업체인TurnerConstruction은이번주발표된포괄적인"전사적"파트너십을통해기업의AI도입트렌드를잘보여주고있습니다.2년계약을통해모든Turner직원이ChatGPTEnterprise에접근할수있게되었으며,회사는AI가운영전반에걸쳐"말그대로모든기능"에도달한다고보고했습니다.​Nashville에서열린Turner의혁신정상회담에서직원들은협업해커톤세션을통해100개이상의맞춤형AI에이전트를만들어계약검토부터안전프로토콜에이르는과제를해결했습니다.이번파트너십은외부솔루션을구매하기보다는내부AI역량을구축하려는Turner의전략을반영하며,회사관계자들은이제"주말동안스스로무언가를구축할수있다"고밝혔습니다.​강력한ROI가비즈니스투자를검증합니다최근연구는도입을촉진하는비즈니스가치를입증하고있습니다.800명의미국기업리더를대상으로한와튼연구에따르면75%가AI투자로부터긍정적인ROI를보고했으며,부정적인수익을보고한경우는5%미만이었습니다.기술및통신부문이88%의긍정적인ROI로선두를차지했으며,은행및금융이83%로그뒤를이었습니다.​기업들은측정가능한결과를보고있습니다:Indeed는OpenAI기술을사용하여채용지원이20%증가하고채용이13%증가했다고보고했으며,Lowe's는1,700개이상의매장에AI기반지원을배포했습니다.Cisco는OpenAI의Codex통합을통해코드검토시간을50%단축하고프로젝트일정을몇주에서며칠로줄였습니다.​OpenAI의기업모멘텀은소비자친숙도를기반으로구축되고있으며,현재Fortune500기업의92%가해당플랫폼을사용하고있습니다.회사는2025년6월까지연간반복매출100억달러를돌파했으며,현재채택률이계속된다면2029년까지1,250억달러를달성할것으로예상하고있습니다.
1269 조회
0 추천
2025.11.06 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입