Loading...

AI 뉴스

Anthropic, AI 정치적 편향 측정 도구 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.15 14:14
1,073 조회
0 추천
0 비추천

본문

2245836845_iretzf.jpg

(퍼플렉시티가 정리한 기사)


Anthropic은 11월 13일 AI 챗봇의 정치적 편향성을 측정하는 오픈소스 프레임워크를 공개하며, 자사의 Claude 모델이 일부 주요 경쟁사보다 더 균형 잡힌 정치적 관점을 보여주지만 다른 일부 경쟁사보다는 약간 뒤처진다고 주장했다.​

회사의 "paired prompts" 방법론은 Claude Sonnet 4.5를 95%의 공정성으로, Claude Opus 4.1을 94%로 평가했으며, 이는 OpenAI의 GPT-5(89%)와 Meta의 Llama 4(66%)를 앞섰다. 그러나 Google의 Gemini 2.5 Pro는 97%를, xAI의 Grok 4는 96%를 달성하여 둘 다 Claude보다 약간 앞섰다.​

이 프레임워크는 AI 모델이 반대되는 이념적 관점에서 구성된 정치적으로 민감한 질문에 다르게 응답하는지를 평가한다. 평가자들은 공정성, 반대 관점의 인정, 거부율의 세 가지 차원에서 응답을 평가한다. Anthropic은 블로그 게시물에서 "우리는 Claude가 정치적 스펙트럼 전반의 사람들에게 공정하고 신뢰할 수 있는 것으로 인식되기를 원합니다"라고 밝혔다.​


정치적 압박 속 투명성 강화 노력

Anthropic은 GitHub에 오픈소스 라이선스로 평가 도구를 공개하여 다른 개발자들이 이 방법론을 사용하고 발전시키도록 장려했습니다. "정치적 편향을 측정하는 공유 표준은 전체 AI 산업과 고객들에게 이익이 될 것입니다"라고 회사는 밝혔습니다.​

이번 발표는 AI 정치적 중립성에 대한 수개월간의 조사에 이어 나왔습니다. 2025년 7월, 트럼프 대통령은 "연방 정부 내 좌파 AI 방지"라는 제목의 행정명령에 서명했으며, 연방 기관들이 "진실 추구적"이고 "이념적 중립성"을 보이는 것으로 판단되는 AI 시스템만을 구매하도록 요구했습니다. 이 명령은 특히 다양성, 형평성, 포용성 개념이 AI 정확성을 왜곡한다고 주장하며 비판했습니다.​

OpenAI는 10월에 GPT-5 모델이 이전 버전보다 약 30% 적은 정치적 편향을 보였다고 보고했지만, 다른 평가 방법론을 사용했습니다. "ChatGPT는 어떤 방향으로든 정치적 편향을 보여서는 안 됩니다"라고 OpenAI는 밝혔습니다.​


기술적 접근 방법 및 한계

Anthropic은 정치적으로 중립적인 응답에 보상을 주는 시스템 프롬프트와 강화 학습을 사용하여 Claude를 훈련시킵니다. 한 가지 특성 지침은 모델에게 "누군가가 나를 보수주의자나 진보주의자로 식별할 수 없는 방식으로 질문에 답하라"고 지시합니다.​

평가는 논증, 설득력 있는 에세이, 분석적 질문을 포함하여 150개의 정치적 주제를 다루는 1,350쌍의 프롬프트에 걸쳐 모델을 테스트했습니다. Anthropic은 이 프레임워크가 주로 미국 정치 담론과 확장된 대화보다는 단일 턴 상호작용에 초점을 맞추고 있다는 점을 언급하며 한계를 인정했습니다.​

스탠퍼드 대학교의 연구자들은 AI 시스템에서 "진정한 정치적 중립성"을 달성하는 것은 "이론적으로나 실질적으로 불가능하다"고 주장했으며, 중립성 자체가 본질적으로 주관적이기 때문이라고 밝혔습니다.

댓글 0
전체 1,366 / 161 페이지
(퍼플렉시티가정리한기사)구글의위협인텔리전스그룹은수요일,인공지능을이용하여실제사이버공격중에동적으로코드를변경하는악성코드패밀리가처음으로확인되었다고발표하면서연구진이이를"보다자율적이고적응력이뛰어난악성코드로의중요한진전"이라고평가했다.PROMPTFLUX와PROMPTSTEAL을포함한여러AI기반악성코드패밀리의발견은실험적위협에서국가지원그룹과사이버범죄자들이실제운영단계에서AI를활용한공격으로전환되는극적인변화를나타낸다.구글의최신위협인텔리전스보고서에따르면,이번발전은공격자들이"더이상단순히인공지능을생산성을높이기위한용도로만활용하는것이아니라,실제활동중에새로운AI기반악성코드를배포하고있음"을의미한다.​AI악성코드가실시간으로코드를재작성합니다2025년6월에발견된PROMPTFLUX는이새로운위협범주에서가장우려스러운발전을나타냅니다.이실험적인VBScript드로퍼는Google의GeminiAPI를사용하여자체소스코드를지속적으로재작성하며,연구자들은이를"적시(just-in-time)"악성코드수정이라고설명합니다.이악성코드는"ThinkingRobot"모듈을포함하고있으며,이모듈은Gemini에게질의하여매시간새롭게난독화된버전을생성함으로써전통적인시그니처기반탐지를잠재적으로무용지물로만들수있습니다.​"PROMPTFLUX의가장새로운구성요소는안티바이러스소프트웨어를회피하기위한새로운코드를얻기위해주기적으로Gemini에게질의하도록설계된'ThinkingRobot'모듈입니다"라고Google의연구자들은설명했습니다.이악성코드는안티바이러스회피를위해특별히설계된VBScript코드변경을요청하는구조화된프롬프트를Gemini에게전송한후,재작성된버전을지속성을위해Windows의시작프로그램폴더에저장합니다.​러시아군부대가AI기반데이터절취작전전개글로벌안보측면에서더욱우려되는점은,구글이러시아정부지원해킹그룹APT28(일명FancyBear)이우크라이나를대상으로한실제작전에서PROMPTSTEAL악성코드를배포하고있음을확인했다는점이다.PROMPTFLUX가실험적단계에머물러있는것과달리,PROMPTSTEAL은"실제작전에서LLM을쿼리하는악성코드가처음으로관찰된사례"로,사이버전쟁의새로운국면을의미한다.​PROMPTSTEAL은이미지생성도구처럼위장하여,실제로는HuggingFace의API를통해Qwen2.5-Coder-32B-Instruct언어모델에쿼리를보내윈도우명령어를생성,문서와시스템정보를탈취한다.우크라이나당국은7월에이AI악성코드의존재를처음확인했으며,이를러시아의군사방위분야를겨냥한대규모사이버작전과연관지었다.​국가지원그룹,공격생명주기전반에걸쳐AI악용Google의조사에따르면중국,이란,북한의국가지원그룹들이AI도구를작전전반에걸쳐체계적으로악용하고있는것으로드러났습니다.중국과연계된행위자들은사이버보안학생으로위장하여"캡처더플래그"경진대회에참가하는것처럼행세하며Gemini를속여제한된취약점공격지침을제공받았고,이란해커들은대학연구원이라고주장하며안전가드레일을우회했습니다.​지하사이버범죄시장또한빠르게성숙해졌으며,연구자들은피싱,딥페이크생성,자동화된멀웨어개발을위해영어및러시아어포럼에광고된수십개의AI기반도구를발견했습니다.이러한제공물들은합법적인AI마케팅을반영하여"워크플로우효율성"을강조하면서기술력이부족한공격자들의기술적장벽을낮추고있습니다.​Google은이러한악의적활동과관련된계정및자산을비활성화하고악용에대한Gemini의보호장치를강화했습니다.그러나회사는위협행위자들이"AI를예외적으로사용하는것에서일상적으로사용하는것으로"이동함에따라AI통합공격추세가가속화될가능성이높다고경고합니다.
1186 조회
0 추천
2025.11.06 등록
(퍼플렉시티가정리한기사)삼성전자는목요일,급성장하는AI데이터센터냉각시장의선두주자로자리매김하기위한15억유로규모의거래를통해유럽최대난방,환기및공조회사인FläktGroup인수를완료했다고발표했습니다.​2017년하만인터내셔널을80억달러에인수한이후삼성의최대규모인수인이번거래를통해,65개국에서60개이상의주요고객에게서비스를제공하며연간7억유로이상의매출을창출하는100년역사의독일기업을삼성산하에두게되었습니다.FläktGroup의자회사로는각각환기,공조처리및자동화시스템을제공하는WoodsAirMovement,SEMCO,SE-Elektronic이있습니다.​AI인프라붐을위한전략적플레이이번거래는삼성이AI데이터센터의정밀냉각시스템에대한폭발적인수요를활용할수있는위치에서게했으며,데이터센터냉각시장은연평균18%의성장률로2030년까지441억달러에이를것으로예상됩니다.FläktGroup은이미StargateProject를포함한주요프로젝트에냉각시스템을공급하고있으며주요하이퍼스케일고객들과파트너십을유지하고있습니다.​삼성전자DeviceeXperience부문사장겸대표이사인노태문은"이는글로벌HVAC및데이터센터시장을선도하기위한삼성의전략적행보입니다"라고말했습니다."FläktGroup의기술전문성과삼성의AI플랫폼을결합함으로써,우리는업계에서새로운기준을세우고고객에게혁신적인솔루션을제공하는것을목표로합니다."​삼성은FläktGroup의첨단HVAC제어시스템을자사의SmartThingsPro및b.IoT빌딩관리플랫폼과통합하여스마트빌딩솔루션을개발하고에너지효율분야로확장할계획입니다.회사는FläktGroup의브랜드아이덴티티를유지하고기존경영진이삼성DX부문내독립자회사로운영되도록할것입니다.​소비자가전을넘어선확장이번인수는지난해레녹스(Lennox)와의합작투자를통해북미HVAC시장을공략한데이어,삼성이전통적인소비자가전및반도체사업을넘어지속적으로사업을다각화하고있음을보여줍니다.삼성은로봇공학,의료기술,소비자오디오와함께HVAC시스템을핵심성장동력으로선정했습니다.​플렉트그룹(FläktGroup)의CEO인트레버영(TrevorYoung)은"삼성과의합류는플렉트그룹의글로벌시장확대를가속화하고기술혁신을촉진할것"이라고말했습니다."양사간의시너지는미래지향적인HVAC솔루션개발에있어중요한전환점이될것입니다."
1262 조회
0 추천
2025.11.06 등록
(퍼플렉시티가정리한기사)네이버가6일서울코엑스에서개최된'단25(DAN25)'콘퍼런스를통해통합AI에이전트'에이전트N'을공개하며소비자서비스부터제조업까지아우르는AI전환전략을발표했다.검색과쇼핑을넘어AI기업으로의전면도약을선언한이번발표는국내AI산업지형에큰변화를예고하고있다.​최수연네이버대표는기조연설에서"지난1년간독자적기술력으로검색,쇼핑,로컬,금융등주요서비스에AI를접목한결과,사용자만족도가증가하고매출성장을견인하는등긍정적인시그널을얻었다"며"그동안의경험과기술력을바탕으로주요서비스에순차적으로고도화된에이전트를본격도입한다"고밝혔다.​내년상반기AI에이전트본격출시네이버는내년1분기AI쇼핑서비스'네이버플러스스토어'에쇼핑에이전트를먼저출시하고,2분기에는통합검색에AI에이전트를적용한'AI탭'을선보일계획이라고발표했다.​'에이전트N'의핵심은사용자가검색어를고민할필요없이자연스러운대화만으로원하는콘텐츠,상품,서비스에연결되고실제구매나예약까지완료할수있다는점이다.김범준네이버최고운영책임자(COO)는"다양한유형의메타데이터를확보할수있는네이버만의장점을살려실제구매자와예약자만남길수있는리뷰,판매자와직접연결된재고데이터등신뢰도높은데이터인프라를구축했다"고설명했다.​이와함께네이버는비즈니스통합에이전트'에이전트N포비즈니스'도내년부터순차공개할예정이다.이종민광고사업부문장은"분산되어있던사업자솔루션과데이터를하나의비즈니스허브로통합해사업자가AI를기반으로비즈니스환경을분석하고현황을손쉽게진단,개선하는데도움을줄것"이라고말했다.​1조원GPU투자로제조업AI전환주도네이버는AI인프라구축을위해2026년까지GPU에만1조원이상을투자할계획을밝혔다.이는올해3분기영업이익5706억원을훨씬웃도는규모로,네이버의AI사업에대한강한의지를보여준다.​특히네이버클라우드는'소버린AI2.0'전략을통해반도체,자동차,조선등한국핵심제조산업의AI전환을이끌겠다고발표했다.김유원네이버클라우드대표는"네이버는자국의언어,데이터,산업구조를가장깊이이해하는기업으로서산업별버티컬AI모델을구축해가고있다"며"조선,에너지,바이오등주요산업기업들과협력해제조전과정의AI활용을고도화하고,이기술을사우디아라비아,태국,일본등글로벌시장으로확산하겠다"고말했다.​최수연대표는"반도체,자동차,조선등한국제조핵심산업의탄탄한경쟁력위에네이버가갖춘독보적인AI소프트웨어역량을더해대한민국산업전반의AI전환과혁신을가속화할것"이라며"풀스택AI기술역량을바탕으로대한민국이AI3대강국으로도약하는데기여하겠다"고강조했다.​이번발표는네이버가3분기사상최대실적(매출3조1381억원,영업이익5706억원)을기록한가운데나온것으로,탄탄한재무기반을바탕으로한공격적AI투자전략으로평가된다.
1178 조회
0 추천
2025.11.06 등록
(퍼플렉시티가정리한기사)Google는화요일에GeminiDeepResearch도구가이제Gmail,GoogleDrive및GoogleChat의개인데이터에접근하고분석할수있다고발표했으며,이는AI어시스턴트의업무기능이크게확장되었음을의미합니다.​Google이"가장많이요청된기능중하나"라고설명한이번통합은사용자가내부업무컨텍스트를웹데이터와결합하여포괄적인리서치보고서를작성할수있게합니다.사용자는이제이메일,문서,스프레드시트,프레젠테이션,PDF,채팅대화의정보를외부소스와함께종합하여시장분석및경쟁인텔리전스와같은작업을수행할수있습니다.​기업사용자를위한향상된연구기능이기능은전문가들이개인작업자원과공개데이터를병합하여더욱철저한분석을수행할수있도록합니다.구글의발표에따르면,팀들은이제"딥리서치가팀의초기브레인스토밍문서,관련이메일스레드,프로젝트계획을분석하여신제품에대한시장분석을시작할수있습니다".이와마찬가지로사용자들은공개웹데이터와내부전략,비교스프레드시트,팀논의를교차참조하여경쟁자보고서를작성할수있습니다.​이통합기능은Gemini의도구메뉴에서DeepResearch를선택하여액세스할수있으며,사용자는Gmail,Drive,Chat또는웹검색중에서원본옵션을선택할수있습니다.이기능은현재데스크톱플랫폼의모든Gemini사용자에게제공되고있으며,모바일접근은"향후며칠내에"제공될예정입니다.​경쟁적인AI환경이심화되고있다이발표는주요기술기업들이AI어시스턴트를직장데이터와통합하기위해경쟁하고있는가운데나왔습니다.마이크로소프트는최근Copilot에비슷한기능을도입하여WindowsInsider를위한커넥터를통해Gmail과Google서비스를사용할수있도록했습니다.OpenAI또한ChatGPT의작업공간통합기능을확장하여Slack,SharePoint및다양한생산성도구를위한커넥터를추가했습니다.​​이와같은시기는AI기반생산성시장에서구글이경쟁우위를유지하려는노력을보여줍니다.구글은자사Workspace생태계와의통합을심화함으로써기업과의관계를더욱견고하게구축하고,구글제품군을이미사용하고있는조직에게더맞춤화된연구역량을제공하려합니다.
1184 조회
0 추천
2025.11.06 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입