AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 01.04 14:32
330 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 36 페이지
최근 소셜네트워크서비스(SNS)에서 실제 전문의가 아닌 인공지능(AI)이 합성해 만든 '가짜 의사'들이 특정 영양제나 치료제를 추천하는 허위·과장 광고가 급증하면서, 특히 고령층 소비자들의 피해가 잇따르고 있습니다. 이들 가짜 의사는 실제 유명인이나 의사를 딥페이크로 합성하는 등 자연스러운 모습으로 소비자를 기만하여 식·의약품 및 건강기능식품 관련 허위 광고가 빠르게 확산되는 상황입니다. 이에 정부는 AI 기반 허위광고에 대한 강력한 대응책을 마련하고 나섰습니다.정부는 김민석 국무총리 주재 국가정책조정회의에서 'AI 활용 시장질서 교란 광고 대응 방안'을 발표하고, AI 기반 허위·과장 광고를 24시간 단위로 신속하게 차단할 것이라고 밝혔습니다. 주요 내용은 AI로 만든 얼굴, 음성, 영상이 포함된 광고물에 'AI 생성물'이라는 표시를 의무화하는 것이며, 이를 삭제하거나 훼손하는 행위는 금지됩니다. 또한, 플랫폼 사업자에게 게시자가 표시 의무를 이행했는지 관리할 책임이 주어지며, 관련 가이드라인은 내년 시행되는 'AI 기본법'과 연계하여 추가로 마련될 예정입니다.AI 기반 허위광고가 빈발하는 식·의약품 등 품목에 대해서는 방송미디어통신위원회(방미통위)의 서면 심의 대상에 추가하고, 심의 요청 후 24시간 내 신속 심의가 이뤄지도록 패스트트랙을 확대합니다. 특히 AI 합성 의사가 식·의약품을 추천하는 것은 '소비자 기만 광고'로 간주하여 제재를 강화하며, 악성 허위·조작 정보 유통에 대해서는 손해액 최대 5배의 징벌적 손해배상 및 표시·광고법상 과징금 상향을 도입할 계획입니다. 정부는 신기술의 부작용을 최소화하고 AI 시대에 맞는 새로운 시장 질서를 확립하기 위해 법령 개정과 제도 보완을 신속히 추진할 방침입니다.
477 조회
0 추천
2025.12.10 등록
Bloomberg은 Apple의 인공지능에 대한 신중한 접근 방식이 한때 약점으로 여겨졌으나, 시장이 기술 업계의 대규모 AI 지출에 회의적으로 변하면서 경쟁 우위로 전환되었다고 보도했습니다.2025년 6월 이후, Apple의 주가는 35% 급등한 반면 AI 중심 경쟁사인 Meta Platforms와 Amazon은 마이너스 영역으로 하락했으며, 이로 인해 Apple의 시가총액은 4조 1천억 달러에 달하고 S&P 500에서 두 번째로 큰 기업으로 자리매김했습니다.Apple이 자본 지출 경쟁을 피한 반면, 기술 거대 기업인 Google, Meta, Microsoft, Amazon은 지난 1년 동안에만 AI 인프라에 3,600억 달러 이상을 지출했으며, 업계 전체 AI 자본 지출은 2027년까지 6,000억 달러에 달할 것으로 예상됩니다
452 조회
0 추천
2025.12.10 등록
OpenAI, Anthropic, Block은 Linux Foundation 산하에 Agentic AI Foundation을 설립하여 독립적으로 계획하고, 추론하며, 복잡한 작업을 수행할 수 있는 자율 AI 시스템을 위한 개방형 표준을 확립했습니다.세 회사는 Anthropic의 Model Context Protocol(10,000개 이상의 서버에서 채택되고 ChatGPT, Microsoft Copilot, Google Gemini에 통합됨), OpenAI의 AGENTS.md 사양(40,000개의 오픈소스 프로젝트에서 사용됨), Block의 Goose 프레임워크를 포함하여 널리 채택된 기술들을 기여했습니다.Amazon, Bloomberg, Cloudflare, Google, Microsoft를 포함한 플래티넘 멤버들이 이 이니셔티브에 합류했으며, 이는 에이전틱 AI가 소수의 기업에 의해 독점적으로 통제되기보다는 개방형 표준을 통해 발전하도록 보장하는 것을 목표로 합니다.
459 조회
0 추천
2025.12.10 등록
OpenAI CEO 샘 알트만은 월요일 뉴욕에서 기자들과의 오찬에서 애플을 회사의 주요 장기 경쟁자로 지목했으며, 미래의 인공지능 경쟁은 소프트웨어만이 아닌 디바이스를 통해 승리할 것이라고 주장했다고 The Wall Street Journal이 보도했다. 이 발언은 알트만이 지난주 내부적으로 “코드 레드”를 발령하여 직원들에게 8주 동안 부수 프로젝트를 중단하고 구글로부터의 증가하는 압박 속에서 ChatGPT 강화에만 전념할 것을 지시한 가운데 나왔다.오찬에서 알트만은 업계가 OpenAI의 경쟁 위협을 잘못 파악하고 있다고 주장하며, 현재의 스마트폰은 “단순히 AI 컴패니언을 위해 만들어지지 않았다”고 Journal에 밝혔다. 이러한 전략적 비전은 OpenAI의 극적인 변화를 강조하는데, 회사는 Sora 비디오 생성기를 포함한 문샷 프로젝트들을 포기하고 대중 시장 어필을 추구하고 있다.하드웨어 야심이 공격적인 인재 영입전을 부추기다OpenAI는 지난 한 달 동안만 40명 이상의 Apple 하드웨어 엔지니어를 영입했다고 Bloomberg가 보도했으며, 채용된 인력은 카메라 엔지니어링, 웨어러블, 로보틱스, 오디오 기술 분야에 걸쳐 있다. 이러한 이탈은 OpenAI가 5월에 전설적인 디자이너 Jony Ive가 전 Apple 임원인 Tang Tan 및 Evans Hankey와 함께 공동 창립한 AI 기기 스타트업 io를 65억 달러에 인수한 이후 가속화되었다. 팀은 “15~20개의 정말 매력적인 제품 아이디어”를 창출했으며 2026년 말까지 기기 출시를 목표로 하고 있으며, Ive는 프로토타입을 “우아하고, 아름답고, 유쾌하다”고 묘사했다.이러한 인재 유출은 Apple의 AI 부서를 황폐화시켰다. Apple의 100명 규모 파운데이션 모델 팀을 이끌었던 Ruoming Pang은 2억 달러를 초과하는 보상 패키지와 함께 7월에 메타로 떠났다고 Bloomberg가 보도했다. Apple의 AI 검색 노력을 총괄하던 수석 이사 Ke Yang은 10월에 Meta로 이직했다. 이러한 이탈로 인해 Apple은 2026년까지 지연된 Siri 업그레이드를 구동하기 위해 Google의 Gemini를 테스트하게 되었으며, 회사는 1.2조 파라미터 모델에 대해 연간 10억 달러 규모의 거래를 모색하고 있다.구글은 즉각적인 경쟁 압력을 가한다Altman이 Apple의 장기적인 하드웨어 위협에 집중하는 동안, Google의 Gemini 3는 11월에 1501점으로 영향력 있는 LM Arena 리더보드 1위를 차지하며 ChatGPT를 앞질렀고 이는 “코드 레드” 선언을 촉발했다. OpenAI는 원래 12월 말 일정보다 앞당겨 12월 9일 화요일에 모델 5.2를 출시할 계획이며, Altman은 내부 평가 결과 “Gemini 3보다 앞서 있다”고 주장했다. 이러한 일정 가속화는 ChatGPT의 주간 사용자 8억 명이 Gemini의 빠르게 증가하는 월간 사용자 6억 5천만 명과의 경쟁에 직면하면서 증가하는 압박을 반영한다.
458 조회
0 추천
2025.12.10 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입