AI 뉴스

AI 모델은 진실을 희생시키면서 설득력을 얻는다

페이지 정보

작성자 이수
작성일 2025.12.16 16:05
387 조회
0 추천
0 비추천

본문

1758594228-4524.jpg

 

최신 AI 언어 모델들은 정치적 설득에 매우 효과적이 되고 있지만, 우려스러운 새로운 연구는 이들이 기시 갤로핑(Gish galloping)이라는 토론 전술—상대방을 빠른 주장의 흐름으로 압도하는 기법—을 통해 사실적 정확성을 희생함으로써 이러한 힘을 얻는다는 것을 밝혀냈습니다.

옥스퍼드 대학교, 런던 정치경제대학교, 영국 AI 보안 연구소의 과학자들은 약 77,000명의 참가자를 대상으로 19개의 언어 모델을 테스트했으며, 연구자들은 이를 현재까지 AI 설득에 대한 가장 큰 규모의 체계적 조사라고 설명합니다. 12월 3일 저널 Science에 발표된 연구 결과는 설득력과 진실 사이의 직접적인 트레이드오프를 보여줍니다.​

GPT-4o와 같은 언어 모델이 의료 예산이나 이민 정책과 같은 정치적 문제에 대해 "사실과 정보에 집중"하여 사용자를 설득하도록 지시받았을 때, 10분간의 상호작용 동안 약 25개의 주장을 생성했습니다. 2025년 3월 버전의 GPT-4o는 표준 조건에서 78%의 정확한 주장을 만들었지만, 정보로 사용자를 압도하도록 프롬프트되었을 때 정확도는 62%로 급락했습니다. GPT-4.5는 더욱 급격한 하락을 보여 70%에서 56%로 정확도가 떨어졌습니다.

 

기시 갤럽 효과

미국의 창조론자 듀안 기시(Duane Gish)의 이름을 딴 이 전술은, 점점 더 검증하거나 반박하기 어려워지는 사실과 통계의 빠른 흐름으로 상대를 압도하는 것을 포함한다. 이 기법은 논증의 질보다 양을 우선시하며, 인류학자 유지니 스콧(Eugenie Scott)이 확립한 정의에 따르면 종종 "반쪽짜리 진실, 왜곡, 그리고 노골적인 거짓말"을 포함한다.​

옥스퍼드 연구는 전문화된 훈련 방법과 전략적 프롬프팅이 AI의 설득력을 각각 최대 51%와 27%까지 증가시켰다는 것을 발견했다—이는 종종 모델 규모를 늘리는 것보다 더 큰 향상이었다. 모델 간 설득력의 설명 가능한 변동 중 대략 절반은 정보 밀도, 즉 대화 중 생성된 사실 확인 가능한 주장의 순수한 양으로 추적될 수 있었다.

 

민주주의의 딜레마

연구 결과는 초기의 낙관론에서 우려스러운 반전을 보여줍니다. 작년에 과학자들은 AI 챗봇이 합리적인 사실로 음모론을 다룸으로써 잘못된 정보에 맞서 싸울 수 있다는 희망을 제시했습니다. 5월 Nature에 발표된 별도의 연구에서는 개인 정보에 접근할 수 있는 GPT-4가 인간 토론자보다 사용자를 설득할 확률이 81.2% 더 높다는 것을 발견했습니다.​

Bloomberg Opinion 칼럼니스트 Parmy Olson에 따르면, 중간 규모의 자원을 가진 캠페인이 약 50,000달러의 컴퓨팅 비용으로 이러한 설득 봇을 배치할 수 있다고 합니다. 연구자들은 이념적 아이디어를 추진하거나, 정치적 불안을 조성하거나, 정치 시스템을 불안정하게 만들려는 누구나 설득 캠페인을 위해 오픈 소스 모델을 사용할 수 있다고 경고합니다. 연구는 설득 효과가 초기 대화 후 최소 한 달 동안 지속되었음을 보여주었습니다.

댓글 0
전체 1,366 / 3 페이지
Executive Summary• OpenAI가 전 CTO 미라 무라티(Mira Murati)의 AI 스타트업 '씽킹 머신스 랩(Thinking Machines Lab)'에서 공동 창업자 바렛 조프(Barret Zoph)와 루크 메츠(Luke Metz) 등 핵심 인력을 재영입• 씽킹 머신스 측은 조프가 심각한 비위 행위를 저질렀다고 주장하며, 기밀 정보 유출 가능성까지 제기한 상황• OpenAI는 이번 영입이 수주 전부터 진행된 것이라고 해명하며, 조프의 윤리성에 대한 씽킹 머신스의 우려를 공유하지 않는다고 밝혀Background조프와 메츠는 2024년 말 OpenAI를 떠나 무라티가 설립한 씽킹 머신스 랩에 합류했다가, 불과 수개월 만에 다시 OpenAI로 복귀하게 됐다. 이번 사건은 2023년 샘 알트먼(Sam Altman) CEO의 일시 해임 사태 이후 계속되는 AI 업계의 격변을 보여주는 단적인 예다.Impact & ImplicationsAI 인재 시장의 과열AI 연구원들이 수십억 달러 규모의 시드 라운드를 손쉽게 유치할 수 있는 현 상황에서, 인재 쟁탈전은 더욱 치열해질 전망이다. xAI의 이고르 바부슈킨(Igor Babuschkin), Safe Superintelligence의 다니엘 그로스(Daniel Gross), Meta의 얀 르쿤(Yann LeCun) 등 주요 AI 연구소 공동 창업자들의 이탈이 잇따르고 있으며, 이번 사건도 같은 맥락에서 이해할 수 있다.기업 비밀과 인재 이동의 충돌씽킹 머신스 측이 기밀 정보 유출 가능성을 제기한 점은 AI 스타트업 간 인재 이동에서 발생할 수 있는 법적·윤리적 문제를 부각시킨다. 이는 향후 AI 기업들이 핵심 인력의 경쟁사 이직을 막기 위한 계약 조항을 강화할 가능성을 시사한다.AI 에이전트 개발 경쟁 심화기사에 따르면 AI 연구소들은 맥킨지 컨설턴트, 골드만삭스 뱅커, 하버드 의사 등 전문가들의 실제 업무 데이터를 활용해 AI 에이전트를 훈련시키고 있다. 이러한 '환경(environments)' 구축을 통해 AI가 실제 업무 소프트웨어를 학습하도록 하는 방식이 확산되고 있으며, 이는 향후 지식 노동의 AI 자동화를 가속화할 것으로 예상된다.Key Data & Facts항목수치/내용복귀 인원바렛 조프, 루크 메츠, 샘 쇤홀츠 + 추가 2명 예정조프의 이전 직책씽킹 머신스 랩 공동 창업자AI 데이터 계약 시급시간당 최대 $100 이상주요 데이터 공급업체Handshake, Mercor, Surge, TuringKey Quote"지난 1년간 AI 연구소들은 법률, 의료, 컨설팅, 금융 등 다양한 지식 노동 영역에서 모델을 훈련하고 미세 조정해야 한다는 점을 점점 더 인식하게 됐습니다."— 아론 레비(Aaron Levie), Box CEO
98 조회
0 추천
01.20 등록
Executive Summary• 앤트로픽이 개발자용 Claude Code를 비기술 사용자도 쉽게 사용할 수 있도록 만든 새로운 AI 에이전트 'Cowork' 베타 출시• 파일 정리, 형식 변환, 이메일 관리, 웹 검색 등 기본적인 컴퓨터 작업을 자동화하는 데 초점• 월 100달러 구독자 대상 연구 프리뷰로 공개, 현재 Mac 전용으로 제공• 프롬프트 인젝션 공격 등 보안 위험에 대비해 가상 머신 기반 샌드박스, 폴더별 접근 권한 설정 등 다중 안전장치 적용• 실사용 테스트에서 스크린샷 폴더 정리, Gmail 정리 등 기본 작업에서 안정적인 성능 확인Background지난해 앤트로픽의 Claude Code는 개발자들 사이에서 코드베이스 이해와 명령 실행 능력으로 큰 인기를 얻었다. 하지만 대부분의 일반 사용자에게 터미널 기반 인터페이스는 여전히 진입장벽이 높았다. 이에 앤트로픽은 비기술 사용자를 위한 접근성 높은 버전 개발에 착수했으며, 2개월간 AI 도구를 활용해 Cowork를 구축했다.Impact & Implications기술적 의미Cowork는 AI 에이전트 기술의 실용성을 입증하는 중요한 사례다. 그동안 수많은 AI 에이전트들이 과대광고에 비해 기본적인 작업조차 완료하지 못하는 문제를 보여왔다. 앤트로픽은 가상 머신 기반 샌드박스 환경에서 특정 폴더만 접근 가능하도록 설계해 보안과 사용성의 균형을 맞췄다.사용자 영향일반 사용자들이 터미널 없이도 AI 에이전트의 자동화 기능을 활용할 수 있게 되었다. 파일 정리, 이메일 관리 같은 반복적인 작업을 AI에 위임하는 '컴퓨터 사용 경험의 진화'가 시작되는 셈이다. 다만 프롬프트 인젝션 공격 위험으로 인해 민감한 금융 정보나 개인 기록에는 사용을 자제해야 한다.경쟁 구도 변화OpenAI, 구글 등 경쟁사들도 유사한 에이전트 기능을 개발 중인 가운데, 앤트로픽이 사용자 친화적 인터페이스로 선점 효과를 노리고 있다. 특히 이미 Claude Code로 개발자 시장에서 입지를 다진 만큼, Cowork를 통한 일반 소비자 시장 확대 전략으로 볼 수 있다.Key Data & Facts항목수치/내용출시 형태연구 프리뷰 (베타)구독 요금월 $100 (Max 플랜)지원 플랫폼macOS 전용주요 기능파일 정리, 형식 변환, 이메일 관리, 웹 검색보안 방식가상 머신 샌드박스, 폴더별 권한 설정개발 기간약 2개월 (AI 도구 활용)Key Quote"We tried a bunch of different ideas to see what form factor would make sense for a less technical audience that doesn't want to use a terminal."— Boris Cherny, 앤트로픽 Claude Code 총괄
131 조회
0 추천
01.19 등록
Executive Summary• OpenAI가 수주 내 미국에서 ChatGPT 광고 테스트를 시작하며, 무료 및 Go 구독 사용자에게 쇼핑 관련 광고를 노출할 예정• 광고는 AI 응답과 별도로 하단에 명확히 표시되며, 사용자 데이터를 광고주에게 판매하지 않고 대화 내용도 광고주와 공유하지 않을 것이라고 밝힘• Plus, Pro, Enterprise 구독자는 광고가 표시되지 않으며, 18세 미만 및 건강·정치 등 민감한 주제에서는 광고가 제외됨BackgroundOpenAI의 ChatGPT는 주간 활성 사용자 8억 명 이상을 보유한 세계 최대 AI 소비자 제품 중 하나로 성장했다. 그러나 대부분의 사용자가 무료로 서비스를 이용하고 있어, 지금까지 약 640억 달러를 투자받은 OpenAI로서는 수익화 압박이 커지고 있었다. Google Gemini 등 경쟁사의 도전이 거세지면서 대규모 사용자층을 수익으로 전환해야 할 필요성이 더욱 절실해진 상황이다.Impact & Implications산업/시장 영향이번 광고 도입은 AI 챗봇 시장의 수익 모델에 중대한 전환점이 될 전망이다. ChatGPT의 광고 모델이 성공할 경우, 다른 AI 기업들도 유사한 전략을 채택할 가능성이 높다. OpenAI는 광고주에게 개별 사용자 정보(나이, 위치, 관심사 등)를 공개하지 않고, 대신 광고 노출 횟수나 클릭 수 같은 집계 데이터만 제공할 계획이다. 이는 기존 디지털 광고 생태계와 차별화된 접근법으로, 프라이버시를 중시하는 새로운 광고 모델의 시험대가 될 것이다.사용자 경험 영향OpenAI 애플리케이션 CEO 피지 시모는 "ChatGPT의 응답은 광고가 아닌 객관적으로 유용한 정보에 의해 결정된다는 신뢰가 필수"라고 강조했다. 광고는 챗봇 응답 아래 별도 영역에 표시되며, 사용자는 광고 개인화를 끄거나 광고용 데이터를 삭제할 수 있다. 그러나 시모는 향후 "정적인 메시지와 링크를 넘어선" 대화형 광고 경험을 암시하며, 사용자가 광고 상품에 대해 직접 질문할 수 있는 기능을 예고했다.향후 전망OpenAI는 "시간 소모 최적화"를 하지 않으며 "수익보다 사용자 신뢰와 경험을 우선시한다"고 밝혔다. 그러나 업계에서는 소셜 미디어가 겪었던 '사용자 경험 악화(enshittification)' 현상이 AI 챗봇에도 재현될 수 있다는 우려가 제기된다. Sam Altman CEO 역시 과거 소셜 미디어 시대의 실패, 특히 중독성 알고리즘의 부작용을 인정한 바 있어, 향후 광고 확대 과정에서 이러한 실수를 반복하지 않는 것이 OpenAI의 과제가 될 것이다.Key Data & Facts항목수치/내용ChatGPT 주간 활성 사용자8억 명 이상OpenAI 총 투자 유치액약 640억 달러ChatGPT Go 구독료월 8달러광고 적용 대상미국 내 무료 및 Go 사용자광고 제외 구독Plus, Pro, EnterpriseKey Quote"People trust ChatGPT for many important and personal tasks, so as we introduce ads, it's crucial we preserve what makes ChatGPT valuable in the first place. That means you need to trust that ChatGPT's responses are driven by what's objectively useful, never by advertising."— Fidji Simo, OpenAI CEO of Applications
161 조회
0 추천
01.18 등록
Executive Summary• 메타가 왓츠앱, 메신저, 인스타그램에 자체 AI 어시스턴트를 전면 도입• Llama 2 기반 커스텀 LLM으로 개발, 마이크로소프트 Bing과 연동해 실시간 웹 검색 지원• MrBeast, 스눕독 등 유명인 기반 28개 AI 캐릭터 동시 출시• ChatGPT 등 경쟁 서비스와 달리 무료 이미지 생성 기능 탑재• 수십억 일간 활성 사용자를 보유한 메타의 '유통망' 강점을 활용한 AI 전략BackgroundOpenAI의 ChatGPT가 촉발한 AI 챗봇 경쟁이 치열해지는 가운데, 메타가 자사 메시징 플랫폼의 압도적 규모를 무기로 AI 시장에 본격 진입했다. Llama 2 오픈소스 모델의 성공적 확산을 기반으로, 메타는 범용 AI 어시스턴트와 독특한 AI 캐릭터 라인업을 동시에 선보이며 차별화를 시도하고 있다.Impact & Implications산업/시장 영향메타의 AI 어시스턴트 출시는 ChatGPT, Claude 등 기존 AI 챗봇 시장에 상당한 파장을 일으킬 전망이다. 왓츠앱, 메신저, 인스타그램을 합산하면 수십억 명의 일간 사용자를 보유한 메타는 별도 앱 설치나 회원가입 없이 기존 채팅 환경에서 바로 AI를 활용할 수 있다는 점에서 접근성 측면의 압도적 우위를 점한다.기술적 의미메타는 Llama 2의 핵심 원리를 기반으로 대화에 최적화된 커스텀 모델을 구축했다. 특히 컨텍스트 윈도우를 확장해 더 깊은 대화가 가능하도록 했으며, 간결한 답변을 제공하도록 튜닝했다. Bing과의 파트너십을 통해 실시간 웹 정보를 제공하는 점도 무료 AI 서비스로서는 이례적이다.사용자 영향일반 사용자들은 이제 별도의 AI 앱 없이 일상적으로 사용하는 메신저 내에서 여행 계획, 정보 검색, 이미지 생성 등을 수행할 수 있게 됐다. 유명인 기반 AI 캐릭터는 새로운 형태의 엔터테인먼트 경험을 제공하며, 애니메이션 프로필 이미지 등 몰입감을 높이는 요소도 포함됐다.Key Data & Facts항목수치/내용출시 플랫폼WhatsApp, Messenger, InstagramAI 캐릭터 수28개 (유명인 기반 포함)기반 모델Llama 2 원리 기반 커스텀 LLM웹 검색 파트너Microsoft Bing안전성 테스트6,000시간 레드팀 테스트가격무료Key Quote"기존 AI들은 로봇 같거나 밋밋할 수 있다. 우리는 대화형이고 친근한 어조를 만들기 위해 추가 데이터셋을 정제하는 데 시간을 투자했다."— 아마드 알-다흘레, 메타 생성AI 부사장
217 조회
0 추천
01.17 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입