AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 01.04 14:32
300 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 15 페이지
소형모듈식원자로(SMR)는기존원전의위험성을안고있으면서도규모의경제를실현하지못해실제경제성은오히려떨어진다는전문가들의경고가나오고있습니다.실제로미국최초의SMR사업이었던뉴스케일(NuScale)프로젝트는건설비용이초기예상보다3배가까이폭등하며작년11월에최종적으로좌초되었습니다.구글과아마존등빅테크기업들이AI데이터센터전력확보를위해SMR에투자하고있으나,재생에너지대비높은비용과기술적실체부족에대한회의론은여전히지속되고있습니다.
302 조회
0 추천
2025.12.28 등록
• SK텔레콤 [SKM +0.98%]은 12월 27일, 미국 및 중국과 함께 글로벌 AI 강국 3위권 진입을 목표로 하는 한국 정부의 초거대 AI 기반 모델 프로젝트의 일환으로 5,190억 개의 매개변수를 가진 한국 최초의 초거대 AI 모델 A.X K1을 공개했습니다.[barchart +1]• 이 모델은 단순히 정보를 소비하는 것이 아니라 더 작은 AI 모델에 지식을 전달하는 “티처 모델”로 기능하며, 1,000만 명 이상의 가입자를 보유한 SK텔레콤의 A-Dot 서비스와 전 세계 1,100만 명 이상의 사용자를 보유한 Liner의 플랫폼에 통합되어 “모두를 위한 AI” 프레임워크를 발전시킬 예정입니다.[barchart +1]• SK하이닉스 [HY9H.F -2.60%], 크래프톤 [259960.KS -2.22%], 리벨리온, 서울대학교를 포함한 8개 기관 컨소시엄은 독자적인 한국 기술을 사용하여 풀스택 AI 생태계를 구축했으며, 국가의 AI 경쟁력을 높이기 위해 A.X K1을 오픈소스로 공개할 계획입니다.[barchart +1]
309 조회
0 추천
2025.12.28 등록
알리바바는 12월 25일 Qwen Code v0.5.0을 공식 출시하여 커맨드라인 도구를 종합 개발 생태계로 전환했습니다. 이번 업데이트를 통해 개발자는 단일 터미널 창 내에서 4개의 동시 인스턴스를 실행할 수 있게 되어, 지능형 질의응답, 실시간 번역, 프로토타이핑, 창의적 드로잉과 같은 여러 작업을 동시에 실행하면서 대화형 작업 간 대기 시간을 없앴습니다.​이번 릴리스는 Qwen Code 대화 인터페이스를 편집기 환경에 직접 임베드하는 VSCode 플러그인과 함께 도구 기능의 프로그래매틱 통합을 가능하게 하는 TypeScript SDK를 도입했습니다. 알리바바 Tongyi Lab의 문서에 따르면 Java, Python 및 추가 프로그래밍 언어에 대한 지원은 향후 릴리스에서 계획되어 있습니다.생태계 통합 및 향상된 기능Qwen Code v0.5.0은 VS Code 및 JetBrains 시리즈를 포함한 주요 통합 개발 환경과의 심층 통합을 지원하며, 플러그인 메커니즘을 통해 코드 리뷰, 테스트 생성, 종속성 분석과 같은 타사 서비스 호출을 가능하게 합니다. 새 버전은 파일 간 및 다중 모듈 프로젝트에 걸친 엔지니어링 수준의 컨텍스트 이해를 강화하여, 코드를 생성하거나 수정할 때 전역 일관성을 유지하기 위해 전체 코드베이스 인덱스를 자동으로 로드합니다.​이번 업데이트에는 단위 테스트 생성, 보안 취약점 스캔, API 문서 자동 생성을 위한 10개 이상의 도구를 제공하는 플러그인 마켓에 대한 얼리 프리뷰 액세스가 포함되어 있습니다. 통이랩(Tongyi Lab)은 장기 목표가 Qwen Code를 중국 개발자를 위한 국내 지능형 소프트웨어 인프라의 핵심 구성 요소로 만드는 것이라고 밝혔습니다.성장하는 AI 코딩 어시스턴트 시장이번 출시로 알리바바는 빠르게 성장하는 AI 코딩 어시스턴트 시장에서 GitHub Copilot 및 Cursor와 같은 기존 도구들과 보다 직접적으로 경쟁할 수 있는 위치에 서게 되었습니다. 글로벌 AI 코드 어시스턴트 시장은 2024년 55억 달러 규모로 평가되었으며, 2034년까지 473억 달러에 달할 것으로 예상되며, 연평균 복합 성장률 24%로 성장할 것으로 전망됩니다. 2025년에는 개발자의 85%가 코딩 및 개발에 AI 도구를 정기적으로 사용하고 있으며, 62%는 최소 하나의 AI 코딩 어시스턴트에 의존하고 있습니다.​알리바바의 Qwen 기반 코딩 모델은 이미 전 세계적으로 2천만 건 이상의 다운로드를 달성했습니다. Qwen 모델로 구동되는 알리바바의 Tongyi Lingma 코딩 어시스턴트는 2024년 6월 AI Programmer 기능 출시 이후 30억 줄 이상의 코드를 생성했습니다. v0.5.0 릴리스는 글로벌 AI 프로그래밍 경쟁이 단일 지점 코드 생성에서 풀스택 엔지니어링 인텔리전스로 전환되고 있음을 반영합니다.
313 조회
0 추천
2025.12.27 등록
OpenAI는 ChatGPT에 "writing blocks"라는 새로운 기능을 출시했으며, 이메일 작성 및 블로그 초안 작성과 같은 작업을 위해 채팅 인터페이스를 포맷된 문서 편집기로 자동 변환합니다. 12월 18일경부터 사용자들에게 나타나기 시작한 이 업데이트는 AI 챗봇이 콘텐츠 생성을 처리하는 방식의 최신 진화를 나타냅니다.​이 기능은 사용자가 ChatGPT의 서식 있는 텍스트 영역 내에서 텍스트를 강조 표시할 때 나타나는 미니 편집기 도구 모음을 도입하여, Word나 Gmail과 같은 외부 애플리케이션에 콘텐츠를 복사하지 않고도 굵게, 기울임꼴, 목록 만들기와 같은 직접적인 서식 작업을 가능하게 합니다. OpenAI 엔지니어 James Zhang은 12월 19일 "Writing blocks는 ChatGPT에서 완벽한 이메일을 작성하기 더 쉽게 만들어줍니다"라고 발표하며, 사용자가 "채팅에서 바로 텍스트를 업데이트하고 서식을 지정"하고 "강조 표시하여 변경을 요청하고, 제안을 수락하거나 거부"할 수 있다고 설명했습니다.​생성된 모든 콘텐츠를 일반 텍스트로 표시하던 기존 채팅 응답과 달리, 새로운 시스템은 사용자가 작성 작업을 수행할 때를 인식하고 대화 인터페이스를 서식 있는 텍스트 편집 영역으로 자동 전환합니다. 12월 25일 이 기능을 보도한 기술 미디어 매체 BleepingComputer에 따르면, ChatGPT는 이제 초안을 단순한 채팅 교환이 아닌 포맷된 문서로 취급합니다.확장된 계획과 함께하는 점진적 출시이 업데이트는 ChatGPT 사용자들에게 단계적으로 배포되고 있으며, OpenAI는 추가 문서 형식에 대한 지원이 나중에 추가될 것이라고 밝혔습니다. 현재 이 기능은 사용자가 완성된 초안을 전송 준비가 되면 이메일 클라이언트에서 직접 열 수 있도록 지원합니다.​기술 매체 AIbase는 이 디자인이 "생성-복사-붙여넣기-서식 지정"이라는 작업 과정의 마찰을 줄여, 특히 비즈니스 이메일, 소셜 미디어 콘텐츠 또는 기사 초안을 자주 작성하는 사용자들에게 창작 과정을 더욱 원활하게 만든다고 보도했습니다. 툴바의 논리는 주류 편집기를 반영하여, 표준 워드 프로세싱 애플리케이션에 이미 익숙한 사용자들에게 최소한의 학습 곡선만 필요합니다.​OpenAI는 표, 코드 블록, 이미지 삽입을 포함한 더 복잡한 문서 요소에 대한 지원을 확대하여 이력서 및 학술 논문과 같은 추가 콘텐츠 시나리오에 적응할 계획입니다. 회사는 아직 이 기능이 모든 사용자에게 언제 도달할지 또는 단계적 출시 단계에서 어떤 구독 등급이 접근 권한을 가지는지 명시하지 않았습니다.
323 조회
0 추천
2025.12.27 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입