Loading...

AI 뉴스

Anthropic, AI 정치적 편향 측정 도구 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.15 14:14
1,118 조회
0 추천
0 비추천

본문

2245836845_iretzf.jpg

(퍼플렉시티가 정리한 기사)


Anthropic은 11월 13일 AI 챗봇의 정치적 편향성을 측정하는 오픈소스 프레임워크를 공개하며, 자사의 Claude 모델이 일부 주요 경쟁사보다 더 균형 잡힌 정치적 관점을 보여주지만 다른 일부 경쟁사보다는 약간 뒤처진다고 주장했다.​

회사의 "paired prompts" 방법론은 Claude Sonnet 4.5를 95%의 공정성으로, Claude Opus 4.1을 94%로 평가했으며, 이는 OpenAI의 GPT-5(89%)와 Meta의 Llama 4(66%)를 앞섰다. 그러나 Google의 Gemini 2.5 Pro는 97%를, xAI의 Grok 4는 96%를 달성하여 둘 다 Claude보다 약간 앞섰다.​

이 프레임워크는 AI 모델이 반대되는 이념적 관점에서 구성된 정치적으로 민감한 질문에 다르게 응답하는지를 평가한다. 평가자들은 공정성, 반대 관점의 인정, 거부율의 세 가지 차원에서 응답을 평가한다. Anthropic은 블로그 게시물에서 "우리는 Claude가 정치적 스펙트럼 전반의 사람들에게 공정하고 신뢰할 수 있는 것으로 인식되기를 원합니다"라고 밝혔다.​


정치적 압박 속 투명성 강화 노력

Anthropic은 GitHub에 오픈소스 라이선스로 평가 도구를 공개하여 다른 개발자들이 이 방법론을 사용하고 발전시키도록 장려했습니다. "정치적 편향을 측정하는 공유 표준은 전체 AI 산업과 고객들에게 이익이 될 것입니다"라고 회사는 밝혔습니다.​

이번 발표는 AI 정치적 중립성에 대한 수개월간의 조사에 이어 나왔습니다. 2025년 7월, 트럼프 대통령은 "연방 정부 내 좌파 AI 방지"라는 제목의 행정명령에 서명했으며, 연방 기관들이 "진실 추구적"이고 "이념적 중립성"을 보이는 것으로 판단되는 AI 시스템만을 구매하도록 요구했습니다. 이 명령은 특히 다양성, 형평성, 포용성 개념이 AI 정확성을 왜곡한다고 주장하며 비판했습니다.​

OpenAI는 10월에 GPT-5 모델이 이전 버전보다 약 30% 적은 정치적 편향을 보였다고 보고했지만, 다른 평가 방법론을 사용했습니다. "ChatGPT는 어떤 방향으로든 정치적 편향을 보여서는 안 됩니다"라고 OpenAI는 밝혔습니다.​


기술적 접근 방법 및 한계

Anthropic은 정치적으로 중립적인 응답에 보상을 주는 시스템 프롬프트와 강화 학습을 사용하여 Claude를 훈련시킵니다. 한 가지 특성 지침은 모델에게 "누군가가 나를 보수주의자나 진보주의자로 식별할 수 없는 방식으로 질문에 답하라"고 지시합니다.​

평가는 논증, 설득력 있는 에세이, 분석적 질문을 포함하여 150개의 정치적 주제를 다루는 1,350쌍의 프롬프트에 걸쳐 모델을 테스트했습니다. Anthropic은 이 프레임워크가 주로 미국 정치 담론과 확장된 대화보다는 단일 턴 상호작용에 초점을 맞추고 있다는 점을 언급하며 한계를 인정했습니다.​

스탠퍼드 대학교의 연구자들은 AI 시스템에서 "진정한 정치적 중립성"을 달성하는 것은 "이론적으로나 실질적으로 불가능하다"고 주장했으며, 중립성 자체가 본질적으로 주관적이기 때문이라고 밝혔습니다.

댓글 0
전체 1,366 / 49 페이지
중국AI스타트업DeepSeek은목요일오픈소스수학적추론모델인DeepSeekMath-V2를공개했으며,이모델은2024년Putnam수학경시대회에서120점만점에118점이라는거의완벽한점수를달성하여인간최고점수인90점을능가했다.6,850억개의매개변수를가진이모델은또한InternationalMathematicalOlympiad2025와ChineseMathematicalOlympiad2024에서금메달수준의성능을달성했다.​DeepSeekMath-V2가IMO수준경시대회에서금메달등급을달성한최초의오픈소스모델이되면서,이번출시는AI기반수학적추론의전환점을나타낸다.올해초유사한이정표를달성한OpenAI와GoogleDeepMind의독점모델들과달리,DeepSeek은HuggingFace와GitHub에서Apache2.0라이선스로모델가중치를공개적으로제공했다.​자기검증프레임워크가AI추론격차를해결하다이모델은최종답변의정확성보다증명의질을우선시하는새로운자기검증프레임워크를도입합니다.DeepSeek연구진은한시스템이수학적증명을생성하는"증명자"역할을하고다른시스템이추론을면밀히검토하는"검토자"역할을하는이중모델아키텍처를설계했습니다.회사의기술논문에따르면,이접근방식은현재AI시스템의중요한한계를해결합니다:"올바른최종답변이올바른추론과정을보장하지는않는다".​그룹상대정책최적화(GroupRelativePolicyOptimization)를기반으로구축된훈련방법론은단순히정답에보상을주는대신증명이완전하고논리적으로건전한지를평가하는검증자우선접근방식을사용합니다.IMO-ProofBench벤치마크에서DeepSeekMath-V2는기본증명에대해99%의성공률을달성하여Google의GeminiDeepThink의89%를크게능가했습니다.​중국,오픈소스AI에서우위확보이번출시는중국이글로벌오픈소스AI시장에서미국을추월하면서이루어졌습니다.11월말MIT와HuggingFace가발표한연구에따르면,중국에서개발된오픈모델은지난1년간전세계다운로드의17%를차지하여처음으로미국개발자들의15.8%점유율을넘어섰습니다.DeepSeek와Alibaba의Qwen모델이중국의오픈모델다운로드를주도하고있습니다.
653 조회
0 추천
2025.11.29 등록
DeepSeek와Alibaba의연구원들이Science저널에논문을발표하며중국의빠르게성장하는규제프레임워크에서투명성증대와보다체계적인피드백을요구한후,인공지능을규제하려는중국의야심찬노력이국제적관심을다시받고있습니다.불과며칠전발표된그들의분석은정책입안자들에게배포전신고의명확성을개선하고,오픈소스AI에대한감독을강화하며,중국의AI산업이급속도로확장됨에따라독립적인검증메커니즘을구현할것을촉구합니다.​확장되는규칙들,남아있는불투명성중국의AI규제환경은놀라운속도로발전해왔습니다.2025년4월까지중국국가인터넷정보판공실(CAC)은2,350개이상의기업으로부터3,739개의생성형AI도구를등록했으며,레지스트리는매달최대300개씩증가하고있습니다.그러나이러한성장에도불구하고AI모델신고절차는여전히매우불투명합니다.신청이거부된개발자들은거의또는전혀설명을받지못하는경우가많으며,승인된모델은통합목록으로만공개됩니다.이러한불투명성은규정준수를복잡하게만들어AI기업들이규제기대치를이해하고적응하기어렵게만듭니다.​저자들은"중국의규정은복잡한모자이크를형성했다"고언급하며,규제프레임워크가혁신과연구를가능하게하지만,중국의국내AI시스템이미국의선도모델에필적하는'최첨단'역량을개발함에따라당국의더명확한소통과투명성이필수적이라고덧붙였습니다.​오픈소스:기회인가위험인가?중국현정권의주요특징중하나는오픈소스AI모델과과학연구에사용되는도구에대한면제조항입니다.이는미국과유럽에서의더엄격한접근방식과뚜렷한대조를이룹니다.그러나전문가들은이러한면제가제대로통제되지않을경우“위험한오용”을초래할수있다고경고합니다.“여론속성또는사회적동원역량”을가진서비스의정의가모호하게남아있어,면제적용범위가얼마나넓을지에대한우려를불러일으키고있습니다.DeepSeek와알리바바연구진은이러한모델이악의적이거나사회를불안정하게만드는목적으로악용되지않도록더엄격한경계와독립적인감독의필요성을주장합니다.​한편,베이징컨설팅기업ConcordiaAI의최근검토에따르면,현재중국의주요AI시스템들은미국과유사한수준의위험성을보이고있어더견고한준수및안전성점검의중요성이더욱커지고있습니다.​시장영향과향후전망중국의규제접근방식은여러기둥위에세워져있습니다:배포전신고,자체평가,AI생성콘텐츠에대한라벨링요구사항,그리고단계적이고때로는실험적인새로운규칙의시행입니다.중국은포괄적인AI법안을제정하지는않았지만,입법자들사이에서초안이검토되고있으며,특히2025년중반이후로방대한기술표준이계속확대되고있습니다.​이러한추진은또한기업들이투명성과안전성에대한새로운기준을충족하기위해노력하면서규정준수도구,모델평가소프트웨어,그리고독립적인감사에대한수요를촉진시켰습니다.DeepSeek와Alibaba논문은추가적인진전이명확한규제지침과제3자검증에달려있음을강조하는데,이는중국의AI생태계가글로벌무대에서성숙해짐에따라책임있는성장을유지하고위험을줄이는데필수적인단계로여겨집니다.​"중국은실제로AI거버넌스에서추종자에서선도자로전환했으며,이는의미가있습니다"라고공동저자이자법학교수인ZhangLinghan은말했지만,현재개발자와정책입안자모두에게도전이되는불투명성을해소하는것이성공의관건이될것이라고언급했습니다.
636 조회
0 추천
2025.11.29 등록
오픈AI와구글(알파벳Inc.)모두이번추수감사절주말에자사의AI도구사용에엄격한제한을두었는데,이는무료접근을보조하던기존방향에서인프라비용이수십억달러로치솟으면서유료구독제로사용자를유도하는변화의신호탄이다.오픈AI는무료소라(Sora)사용자를하루최대6개의영상생성으로제한했으며,이는이전보다줄어든수치다.한편구글은나노바나나프로(NanoBananaPro)무료이미지생성허용량을하루3개에서2개로줄였다.또한구글은무료사용자의Gemini3Pro접근도하루5회프롬프트제공에서"기본접근"으로축소했고,회사의최신지원문서에따르면이제한은"자주변경될수있다"고명시되어있다.​"우리의GPU가과열되고있고,가능한한많은사람들이소라를이용할수있게하고싶습니다!"라고오픈AI의소라책임자빌피블스는X에썼다.이전의임시제한과달리,피블스는이번제한이해제될것이라고언급하지않았고,대신사용자가"필요에따라추가생성량을구매할수있다"고덧붙였다.​인프라부채증가용량부족문제는OpenAI의데이터센터파트너들이회사의AI서비스를구동하는데필요한인프라를구축하기위해거의1,000억달러의부채를축적하면서발생했습니다.FinancialTimes에따르면,,SoftBank,CoreWeave를포함한기업들이OpenAI에투자하거나데이터센터를건설하기위해최소300억달러를차입했으며,추가로380억달러의대출이확정되는중입니다.​Oracle은이미180억달러의회사채를발행했으며,KeyBancCapitalMarkets는OpenAI계약을충족하기위해향후4년동안총1,000억달러의부채를떠안을수있다고추정합니다.OpenAI는8년에걸쳐1.4조달러규모의컴퓨팅계약을체결했는데,이는예상되는연간매출200억달러를훨씬초과하는규모입니다.​구글,엔비디아의지배력에도전하다사용제한조치는메타와구글이2027년부터자사데이터센터에구글의텐서프로세싱유닛(TPU)을도입하는방안에대해협의중이라는보도이후,엔비디아주가가월요일에거의4%하락한것과맞물려나타났습니다.수십억달러에달하는이잠재적계약은현재AI칩시장에서80%이상의점유율을차지하는엔비디아의GPU대신구글TPU로지출이이동하는계기가될수있습니다.​구글의TPU는AI추론작업에서엔비디아의H100GPU보다4배더비용효율적인것으로알려졌으며,이미지생성기미드저니(Midjourney)는2024년에TPU로전환한후추론비용을65%절감했습니다.챗GPT플러스및프로구독자는기존의Sora제한을유지했으나,오픈AI는정확한숫자를명시하지않았습니다.
642 조회
0 추천
2025.11.29 등록
고용노동부와한국고용정보원이28일발표한'2025년기업채용동향조사'에따르면매출상위500대기업의86.7%가인공지능을인사업무에활용하고있는것으로나타났다.이번조사는8월1일부터9월1일까지국내주요기업인사담당자396명과전국청년재직자3,093명을대상으로진행됐다.​채용현장의AI확산과기업의선택AI를공식적으로인사업무에도입한163개기업중52.8%가직원채용에AI를활용하고있으며,교육·훈련(45.4%),인사관련문의응대(45.4%)가그뒤를이었다.직원채용에AI도구를사용하는기업은전체의21.7%인86곳으로,주로AI기반인적성또는역량검사(69.8%),지원서류검토(46.5%),AI면접및대면면접시결과활용(46.5%)등에활용하고있다.​향후채용업무에AI도구를도입하거나확대할계획이있는기업은74.5%에달했다.기업들은도입이유로'데이터에기반한객관적인판단'(34.6%),'채용전형소요시간단축'(31.5%),'업무부담경감'(14.2%)을꼽았다.반면도입계획이없는25.5%의기업은'AI도구의공정성·객관성에대한확신부족'(36.6%)과'최종결정에는사람이개입해야하므로중복업무'(19.8%)를주요이유로들었다.​청년층의AI활용과공정성우려취업준비시AI도구를사용한경험이있는청년은42.3%였으며,이들중77.2%가자기소개서와이력서작성에활용했다.AI를활용한청년의86.6%는취업준비에도움이됐다고응답했다.청년재직자중에서는61.8%가업무수행시AI도구를사용한다고답했으며,IT(87.7%),마케팅·홍보(87.0%),연구개발(79.5%)직종에서활용도가높았다.​청년의63.8%는기업의AI채용전형운영에찬성했지만,실제경험비율은23.7%에그쳤다.청년들은'AI판단기준의공정성우려'(26.9%),'AI심사기준의불투명성'(23.1%),'자기표현의왜곡에대한불안감'(18.4%)등을주요걱정거리로꼽았다.​정부는채용과정에서AI활용시윤리기준과단계별체크리스트를정리한'채용분야인공지능활용가이드라인'을연내마련할계획이다.또한청년들의AI활용역량강화를위해내일배움카드를통한단계별교육·훈련지원을확대하고,42개고용센터에AI면접실을설치했다.임영미고용노동부고용정책실장은"정부는기업이AI를활용해보다공정하게인재를채용할수있도록지원하고,청년들에게는AI관련직무역량을쌓을기회를더많이제공하겠다"고밝혔다.
618 조회
0 추천
2025.11.29 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입