Loading...

AI 뉴스

Anthropic, AI 정치적 편향 측정 도구 출시

페이지 정보

작성자 xtalfi
작성일 11.15 14:14
4 조회
0 추천
0 비추천

본문

2245836845_iretzf.jpg

(퍼플렉시티가 정리한 기사)


Anthropic은 11월 13일 AI 챗봇의 정치적 편향성을 측정하는 오픈소스 프레임워크를 공개하며, 자사의 Claude 모델이 일부 주요 경쟁사보다 더 균형 잡힌 정치적 관점을 보여주지만 다른 일부 경쟁사보다는 약간 뒤처진다고 주장했다.​

회사의 "paired prompts" 방법론은 Claude Sonnet 4.5를 95%의 공정성으로, Claude Opus 4.1을 94%로 평가했으며, 이는 OpenAI의 GPT-5(89%)와 Meta의 Llama 4(66%)를 앞섰다. 그러나 Google의 Gemini 2.5 Pro는 97%를, xAI의 Grok 4는 96%를 달성하여 둘 다 Claude보다 약간 앞섰다.​

이 프레임워크는 AI 모델이 반대되는 이념적 관점에서 구성된 정치적으로 민감한 질문에 다르게 응답하는지를 평가한다. 평가자들은 공정성, 반대 관점의 인정, 거부율의 세 가지 차원에서 응답을 평가한다. Anthropic은 블로그 게시물에서 "우리는 Claude가 정치적 스펙트럼 전반의 사람들에게 공정하고 신뢰할 수 있는 것으로 인식되기를 원합니다"라고 밝혔다.​


정치적 압박 속 투명성 강화 노력

Anthropic은 GitHub에 오픈소스 라이선스로 평가 도구를 공개하여 다른 개발자들이 이 방법론을 사용하고 발전시키도록 장려했습니다. "정치적 편향을 측정하는 공유 표준은 전체 AI 산업과 고객들에게 이익이 될 것입니다"라고 회사는 밝혔습니다.​

이번 발표는 AI 정치적 중립성에 대한 수개월간의 조사에 이어 나왔습니다. 2025년 7월, 트럼프 대통령은 "연방 정부 내 좌파 AI 방지"라는 제목의 행정명령에 서명했으며, 연방 기관들이 "진실 추구적"이고 "이념적 중립성"을 보이는 것으로 판단되는 AI 시스템만을 구매하도록 요구했습니다. 이 명령은 특히 다양성, 형평성, 포용성 개념이 AI 정확성을 왜곡한다고 주장하며 비판했습니다.​

OpenAI는 10월에 GPT-5 모델이 이전 버전보다 약 30% 적은 정치적 편향을 보였다고 보고했지만, 다른 평가 방법론을 사용했습니다. "ChatGPT는 어떤 방향으로든 정치적 편향을 보여서는 안 됩니다"라고 OpenAI는 밝혔습니다.​


기술적 접근 방법 및 한계

Anthropic은 정치적으로 중립적인 응답에 보상을 주는 시스템 프롬프트와 강화 학습을 사용하여 Claude를 훈련시킵니다. 한 가지 특성 지침은 모델에게 "누군가가 나를 보수주의자나 진보주의자로 식별할 수 없는 방식으로 질문에 답하라"고 지시합니다.​

평가는 논증, 설득력 있는 에세이, 분석적 질문을 포함하여 150개의 정치적 주제를 다루는 1,350쌍의 프롬프트에 걸쳐 모델을 테스트했습니다. Anthropic은 이 프레임워크가 주로 미국 정치 담론과 확장된 대화보다는 단일 턴 상호작용에 초점을 맞추고 있다는 점을 언급하며 한계를 인정했습니다.​

스탠퍼드 대학교의 연구자들은 AI 시스템에서 "진정한 정치적 중립성"을 달성하는 것은 "이론적으로나 실질적으로 불가능하다"고 주장했으며, 중립성 자체가 본질적으로 주관적이기 때문이라고 밝혔습니다.

댓글 0
전체 973 / 11 페이지
(퍼플렉시티가 정리한 기사)구글은 목요일 홀리데이 쇼핑 경험을 단순화하기 위한 인공지능 기반 쇼핑 기능 제품군을 공개했으며, 사용자들이 대화형으로 검색하고, 가격을 자동으로 추적하며, 심지어 AI 에이전트가 매장에 전화하거나 대신 구매를 완료할 수 있도록 했다.11월 12일에 발표되어 11월 13일 미국에서 시작되는 이번 출시는, 빠르게 진화하는 AI 커머스 환경에서 아마존, OpenAI의 ChatGPT, 그리고 틱톡과 경쟁하기 위해 회사가 자리매김하면서 구글의 쇼핑 기능에 대한 가장 광범위한 개편을 의미한다.대화형 검색 및 에이전트 기능이번 업데이트의 중심에는 구글 검색에서 사용자가 키워드 대신 자연어로 제품을 설명할 수 있는 강화된 AI 모드가 있습니다. 사용자는 “소음 차단 헤드폰”이라고 입력하는 대신, 이제 “재택근무할 때 집중은 잘 되고, 초인종 소리는 들을 수 있게 도와주는 헤드폰을 찾아주세요”라고 말할 수 있습니다. 이는 구글 광고 및 커머스 담당 부사장 비드야 스리니바산(Vidhya Srinivasan)에 따르면 가능한 일입니다.이 시스템은 구글의 Gemini 모델과 쇼핑 그래프(Shopping Graph)—5천억 개 이상의 상품 목록과 매시간 20억 개가 갱신되는 데이터베이스—에 의해 구동되며, 쇼핑 가능한 이미지, 비교 표, 가격 정보, 재고 정보를 포함한 맞춤형 응답을 생성합니다.구글은 사용자를 대신해 행동하는 “에이전틱(agentic)” AI 기능도 선보입니다. “구글에게 전화하게 하기(Let Google Call)” 기능은 구글의 듀플렉스(Duplex) 기술을 활용하여 현지 매장에 연락하고, 상품의 재고와 가격을 문의하며, 사용자에게 문자나 이메일로 요약 정보를 전송합니다. 이 기능은 처음에는 장난감, 건강/뷰티 제품, 전자제품 카테고리에 제공되며, 통화 시 AI임을 밝히고 판매자가 이를 거부할 수 있도록 합니다.가장 주목할 만한 기능은 에이전틱 결제(agentic checkout)로, 사용자가 지정한 가격에 도달하면 구글이 자동으로 제품을 구매할 수 있습니다. 크기, 색상, 예산 등의 조건을 설정하면 조건이 충족될 때 알림을 받고, 사용자가 구글 페이(Google Pay)로 거래를 승인할 수 있습니다. 이 기능은 Wayfair, Chewy, Quince, 일부 Shopify 판매자를 포함한 소매업체와 함께 출시 중입니다.쇼핑 기능은 Gemini 앱 내에서도 확대되어, 사용자가 하나의 대화 안에서 아이디어를 구상하고 상품을 탐색하는 과정을 이어갈 수 있습니다.경쟁 압력과 산업 변화이번 업데이트는 생성형 AI가 기존의 검색 퍼널을 압축함에 따라 이루어졌습니다. Srinivasan은 언론 브리핑에서 AI Mode 사용자들이 기존 검색보다 2~3배 더 긴 쿼리를 제출하며, 구매 결정에 더 빠르게 도달하고 있다고 말했습니다. Google의 글로벌 광고 부사장인 Dan Taylor는 이러한 변화가 키워드 기반 캠페인에 익숙한 광고주들에게 과제를 제시한다고 인정했습니다.Google의 이러한 움직임은 경쟁사들의 유사한 이니셔티브를 따른 것입니다. 9월에 OpenAI는 ChatGPT에 Instant Checkout을 도입하여 채팅 인터페이스를 벗어나지 않고도 Etsy와 Shopify 판매자로부터 구매할 수 있도록 했습니다. Amazon은 가격 추적 및 AI 쇼핑 어시스턴트를 테스트해 왔으며, CEO Andy Jassy는 10월 실적 발표에서 회사가 쇼핑객들이 제3자 AI 에이전트에 의존하는 미래를 준비하고 있다고 밝혔습니다.[wired +3]업계 전문가들은 AI 플랫폼 내에서 쇼핑이 통합되면 브랜드 웹사이트로의 트래픽이 감소하여 고객 데이터 수집 및 충성도 구축 기회가 제한될 수 있다고 경고합니다. 컨설팅 회사 Merkle의 최고 전략 책임자인 Holden Bale은 6월 Glossy와의 인터뷰에서 “소비자가 브랜드 사이트를 전혀 방문하지 않고 검색에서 구매를 완료하면, 신뢰를 구축할 기회를 잃게 됩니다”라고 말했습니다.
21 조회
0 추천
11.14 등록
(퍼플렉시티가 정리한 기사)두 명의 10대 창업자가 새로운 살충제 분자를 설계하는 인공지능 모델을 구축하기 위해 600만 달러의 시드 라운드를 마감했으며, 이는 수십 년 동안 정체된 혁신을 겪어온 산업에 현대 컴퓨팅 기술이 진입한 드문 사례가 되었습니다.​18세의 타일러 로즈(Tyler Rose)와 19세의 나비예 아난드(Navvye Anand)가 설립한 바인드웰(Bindwell)은 11월 13일 제너럴 카탈리스트(General Catalyst)와 A 캐피털(A Capital)이 공동 주도한 투자 유치를 발표했습니다. Y 컴비네이터(Y Combinator) 공동 창업자인 폴 그레이엄(Paul Graham)이 개인 투자를 했으며, SV 엔젤(SV Angel)도 참여했습니다. 샌프란시스코에 본사를 둔 이 스타트업은 Y 컴비네이터의 2025년 겨울 배치를 졸업했으며, 이전에 캐릭터 캐피털(Character Capital)로부터 프리시드 라운드를 유치한 바 있습니다.소프트웨어에서 분자 설계로의 전환회사의 전략은 Graham의 집에서 나눈 대화 중에 구체화되었다. Rose와 Anand는 처음에 AI 도구를 농약 화학 회사들에 판매할 계획이었지만, 업계 기존 기업들 사이에서 관심이 거의 없다는 것을 발견했다. Graham은 대신 자체적으로 모델을 사용하여 살충제 분자를 발견하고 지적 재산권을 직접 라이선스하는 방안을 제안했다. “창업자들은 아마 잘해낼 것이다”라고 Graham은 나중에 게시했다. “그들은 똑똑하고 좋은 아이디어를 가지고 있다”.기존 화학에 의존하는 대신, Bindwell은 약물 발견 기술을 농업에 적용한다. 이 스타트업은 DeepMind의 AlphaFold보다 4배 빠르게 실행된다고 회사가 밝힌 단백질 구조 예측 도구인 Foldwell과 6시간 내에 알려진 모든 합성 화합물을 스캔할 수 있는 PLAPT를 포함한 AI 모델 제품군을 개발했다. 이 모델들은 인간과 유익한 유기체에 해를 끼치지 않으면서 특정 해충에 고유한 단백질을 표적으로 한다.테스팅 및 초기 파트너십Bindwell은 현재 캘리포니아주 샌카를로스에 위치한 자사 연구소에서 AI가 생성한 분자를 검증하고 있습니다. 회사는 글로벌 농약 기업들과 초기 논의 중이며 향후 몇 달 내에 첫 번째 라이선스 계약을 체결할 것으로 예상하고 있습니다. 두 창업자 모두 농업과 가족적 연고가 있는 인도와 중국에서 현장 테스트가 계획되어 있습니다.이러한 움직임은 업계가 점증하는 압박에 직면한 가운데 나온 것입니다. 유엔 식량농업기구(UN Food and Agriculture Organization)에 따르면, 지난 30년간 농약 사용량이 두 배로 증가했음에도 불구하고 전 세계 작물 생산량의 최대 40%가 매년 해충으로 인해 손실되고 있습니다. 새로운 농약 개발 비용은 지난 30년간 3천만 달러에서 3억 달러로 증가했습니다. 중국에서 농사를 짓는 이모로부터 해충 문제에 대해 배운 Rose는 “해충 제거에는 탁월하지만 다른 것에는 영향을 주지 않는, 더 안전하고 표적화된 농약을 개발하는 것”이 목표라고 말했습니다.
19 조회
0 추천
11.14 등록
(퍼플렉시티가 정리한 기사)드레스덴 기반 반도체 스타트업 Ferroelectric Memory GmbH(FMC)가 AI 데이터 센터의 전력 소비를 대폭 줄이도록 설계된 에너지 절감형 메모리 칩 상용화를 위해 1억 유로를 확보하며, 유럽 반도체 분야에서 가장 큰 규모의 투자 라운드 중 하나를 기록했습니다. 이번 투자는 AI 인프라가 급증하는 에너지 사용량으로 인해 압박을 받고 있는 가운데 이루어졌으며, 데이터 센터는 현재 미국 전체 전력의 4.4%를 소비하고 있으며, 이 수치는 2028년까지 잠재적으로 3배 증가할 것으로 예상됩니다.7,700만 유로 규모의 지분 투자 라운드는 벤처 캐피털 기업인 HV Capital과 DeepTech & Climate Fonds(DTCF)가 주도했으며, Vsquared Ventures와 eCAPITAL, Bosch Ventures, Air Liquide Venture Capital, M Ventures, Verve Ventures를 포함한 기존 투자자들이 참여했습니다. 추가로 2,300만 유로는 IPCEI ME/CT 프로그램과 유럽혁신위원회를 포함한 공공 자금 출처에서 조달되었습니다.AI의 에너지 위기 해결하기FMC의 DRAM+ 및 3D-CACHE+ 메모리 기술은 CEO Thomas Rückes가 “AI 스택의 주요 병목 현상”이라고 부르는 문제를 해결하는 것을 목표로 합니다. 이 회사의 영구 메모리 칩은 휘발성 및 비휘발성 스토리지 간의 에너지 집약적인 데이터 전송을 제거함으로써 기존 제품 대비 시스템 효율성과 처리 속도를 100% 이상 향상시킬 수 있습니다.“지금까지 대역폭이 AI 컴퓨팅의 지배적인 지표였지만, 이제 에너지 효율성이 차세대 AI의 핵심 요소가 되고 있습니다”라고 Rückes는 성명에서 밝혔습니다. 이 기술은 하프늄 산화물 기반의 강유전체 재료를 기반으로 구축되어 메모리 칩의 비휘발성을 가능하게 하며, 시스템이 전원이 꺼진 상태에서도 정보를 유지할 수 있도록 합니다.유럽의 반도체 추진이번 투자는 FMC를 현재 1,000억 유로 이상 규모의 메모리 칩 시장을 지배하고 있는 미국 및 아시아 메모리 공급업체에 대한 의존도를 줄이려는 유럽의 광범위한 전략의 일부로 자리매김합니다. 메모리 생산은 한국의 거대 기업인 SK하이닉스와 삼성, 그리고 미국 기반의 마이크론에 집중되어 있으며, SK하이닉스는 2025년 2분기 기준 고대역폭 메모리 시장의 62%를 점유하고 있습니다.500개 이상의 기업이 모여 있는 유럽 최대의 마이크로일렉트로닉스 허브인 드레스덴의 실리콘 색소니 클러스터에 위치한 FMC는 전 세계 대량 생산 300mm 생산 시설에서 선도적인 DRAM 제조업체 및 첨단 로직 파운드리와의 파트너십을 통해 자사 기술을 상용화할 계획입니다. DTCF의 토르스텐 뢰플러(Dr. Torsten Löffler) 박사는 “FMC는 데이터 센터의 에너지 소비를 지속 가능하게 줄이는 동시에 반도체 부문에서 유럽의 주권을 강화합니다”라고 말했습니다.
18 조회
0 추천
11.14 등록
(퍼플렉시티가 정리한 기사)WisdomAI는 AI 기반 데이터 분석 플랫폼으로, Kleiner Perkins가 주도하고 Nvidia의 벤처 캐피탈 부문인 NVentures가 참여한 시리즈 A 펀딩에서 5천만 달러를 유치했다고 11월 12일 발표했습니다. 이번 라운드는 샌마테오에 본사를 둔 이 스타트업이 Coatue가 주도한 시드 펀딩에서 2천3백만 달러를 유치한 지 불과 6개월 만에 이루어졌으며, 2024년 말 출시 이후 총 조달 자본금은 7천3백만 달러에 달합니다.이러한 연이은 자금 조달은 복잡한 비즈니스 데이터에서 안정적으로 인사이트를 추출할 수 있는 엔터프라이즈 AI 솔루션에 대한 투자자들의 급증하는 관심을 반영합니다. WisdomAI는 출시 당시 2개의 엔터프라이즈 고객에서 Cisco, ConocoPhillips, Patreon을 포함한 약 40개로 성장했으며, 한 고객은 불과 몇 개월 만에 10명에서 450명의 사용자로 확대되었습니다.쿼리 우선 접근 방식으로 AI 환각 방지데이터 보안 기업 Rubrik의 공동 창립자이자 전 수석 설계자인 Soham Mazumdar가 설립한 WisdomAI는 AI 분석 도구를 괴롭혀온 지속적인 문제인 환각(hallucination), 즉 조작된 출력 결과를 해결합니다. 이 플랫폼은 대규모 언어 모델을 답변이 아닌 데이터베이스 쿼리 생성에만 독점적으로 사용하여, 결과가 AI 생성 콘텐츠가 아닌 실제 데이터 소스에서 직접 나오도록 보장합니다.Mazumdar는 성명에서 “우리는 모든 직원이 AI를 통해 데이터로 추론할 수 있는 새로운 시대에 진입하고 있습니다”라고 말했습니다. 플랫폼의 독자적인 “기업 컨텍스트 레이어”는 쿼리를 실행하기 전에 고객별 데이터 정의와 특성을 학습하여, 정확성을 유지하면서 지저분하거나 오류가 있는 데이터셋을 처리할 수 있게 합니다.프로액티브 분석이 정적 대시보드를 대체합니다WisdomAI는 최근 주요 지표에서 관련성 있는 변화가 발생했을 때만 사용자에게 알림을 보내는 에이전트 모니터링 기능을 도입하여 일상적인 보고를 제거했습니다. Mazumdar는 이 기능의 배포에 약 5분이 소요되었으며, 분석을 “정적 보고서”에서 역동적이고 사전 예방적인 인사이트로 전환한다고 말했습니다.이번 투자 자금은 WisdomAI의 엔지니어링 팀 확장, 제품 개발 가속화, 그리고 기술, 의료, 금융 서비스, 에너지, 제조 부문의 포춘 500대 기업을 목표로 하는 시장 진출 운영 확대를 지원할 예정입니다. Kleiner Perkins의 주요 투자자 Aditya Naganath는 WisdomAI가 “데이터에는 빠져있지만 인텔리전스에는 굶주린” 기업들의 “악순환을 끊는다”고 말했습니다.이번 투자는 WisdomAI를 빠르게 성장하는 시장 내에 위치시킵니다. 데이터 분석 분야의 글로벌 AI 시장은 2026년에 403억 달러, 2034년까지 3,109억 7천만 달러에 달할 것으로 예상되며, 연평균 복합 성장률 29.10%로 확대되고 있습니다.
19 조회
0 추천
11.14 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입