Loading...

AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 2026.01.04 14:32
406 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 71 페이지
Google은 BleepingComputer에 따르면, 첫 해 동안 광고 없이 운영했던 AI Mode 답변 엔진에 스폰서 광고를 표시하기 시작했습니다.광고는 AI가 생성한 답변 하단에 “sponsored” 라벨과 함께 표시되며, 이는 사용자에게 더 매력적인 AI 경험을 제공하기 위해 광고를 피했던 Google의 이전 전략에서 전환된 것입니다.이러한 움직임은 Google이 ChatGPT와 같은 광고 없는 AI 검색 대안과의 경쟁에 직면하면서도, 2023년에 2,378억 6천만 달러의 수익을 창출한 지배적인 광고 사업을 보호하기 위한 것입니다.
779 조회
0 추천
2025.11.24 등록
정부가 24일 4년 만에 과학기술관계장관회의를 재개하고 인공지능 대전환을 위한 범부처 전략을 점검했다. 김민석 국무총리가 주재한 이날 첫 회의에서는 ‘AI 민생 10대 프로젝트’를 비롯해 국방·제조·과학기술 등 분야별 AI 전략과 UAE 국빈 방문 성과, 중소기업 지원 방안 등 10개 안건이 논의됐다.AI 혁신 성과 확산에 정부 총력김 총리는 모두발언에서 “AI 대전환 등 변화의 파도에 대응하기 위해 과학기술부총리를 신설했고 과학기술관계장관회의도 다시 시작하게 됐다”며 “‘모두를 위한 AI’라는 비전 아래 혁신의 성과가 골고루 확산되도록 힘쓸 것”이라고 밝혔다. 그는 “AI는 우리 경제의 혁신을 촉진할 새로운 성장 엔진이자 국가 대전환의 강력한 동인”이라며 “오픈AI, 엔비디아 등 글로벌 선도 기업과 전략적 파트너십을 구축하고, 내년 예산안에는 AI 3대 강국 전환의 마중물이 될 10조원 규모의 예산을 담았다”고 강조했다.의장을 맡은 배경훈 부총리 겸 과학기술정보통신부 장관은 “부처 간 칸막이를 없애고 ‘원 팀’으로 협업하는 것이 중요하다”며 “과학기술관계장관회의가 연구개발, AI 기술 확보와 사업화를 위해 건설적이고 신속하게 논의할 수 있는 장이 될 수 있도록 노력하겠다”고 말했다.민생부터 국방까지 AI 전면 적용정부는 이날 회의에서 국민이 AI 혜택을 직접 체감할 수 있는 ‘AI 민생 10대 프로젝트’를 발표했다. 농산물 가격을 AI로 분석해 최적 구매처를 추천하는 플랫폼, 소상공인을 위한 AI 창업·경영 컨설턴트, AI 국세정보 상담사, 보이스피싱 대응 시스템 등이 포함됐으며, 정부는 2026년부터 2개 년간 총 460억원을 지원할 계획이다.국방 분야에서는 무기체계 지능화, AI 전투참모, 스마트 군수지원체계 등 7대 프로젝트를 추진하고, 제조업에서는 2030년까지 500개의 AI 팩토리를 구축하는 선도사업이 진행된다. 중소기업 AI 육성을 위해서는 2030년까지 13조5000억원 규모의 ‘넥스트 유니콘 프로젝트’를 추진한다.이날 회의에는 배경훈 부총리를 비롯해 기획재정·교육·외교·국방·행정안전·문화체육관광·산업통상·보건복지·기후환경에너지·고용노동·중소벤처기업부 장관과 금융위원회·개인정보보호위원회 위원장 등 20명이 참석했다. 과학기술관계장관회의는 노무현 정부 때 처음 신설됐으나 이명박 정부에서 폐지됐다가 2018년 문재인 정부 때 복원됐으며, 2021년 말 마지막 회의 이후 윤석열 정부에서는 열리지 않았다. 정부는 앞으로 매달 회의를 열어 과학기술·AI 정책을 자유 토의 방식으로 논의할 예정이다.
791 조회
0 추천
2025.11.24 등록
카카오뱅크가 24일 인공지능(AI)을 활용해 대화만으로 송금할 수 있는 ‘AI 이체’ 서비스를 출시하며 국내 금융권에서 처음으로 핵심 금융 기능에 생성형 AI를 접목시켰다. 고객이 “엄마에게 10만원 보내줘”라고 말하거나 입력하면 AI가 계좌 정보와 금액을 인식해 송금 절차를 자동으로 처리하는 방식이다.기존에는 은행명, 계좌번호, 이체 금액 등을 단계별로 입력해야 했던 송금 절차가 한 문장으로 단축됐다. 최근 이체 내역이 있는 대상은 이름만으로, 별명을 설정한 경우에는 ‘엄마’, ‘마미’ 등 유사한 표현만으로도 송금이 가능하다. 카카오뱅크 입출금계좌 고객이라면 누구나 이용 가능하며, 1회·1일 최대 200만원까지 송금할 수 있다.보안 강화와 착오송금 방지 절차 마련카카오뱅크는 서비스 출시에 앞서 금융보안원과 모의해킹 기반의 ‘AI 서비스모델 보안 점검’을 합동으로 실시하는 등 내·외부 취약점 검증을 완료했다고 밝혔다. 착오송금을 방지하기 위해 고객의 요청이 불분명하면 재질문을 통해 정보를 명확히 하고, 수취인 검증 등 일반 이체와 동일한 인증 절차를 거쳐야만 최종 이체가 실행된다. 이체 실행 전 최종 단계에서는 주요 정보에 대한 고객 확인 및 인증 과정을 거쳐 안전하게 이용할 수 있다.AI 금융 서비스 확대 행보카카오뱅크는 5월 국내 금융권 최초로 Azure OpenAI 기반 ‘AI 검색’ 서비스를 출시한 이후 대화형 AI 서비스를 지속 확대하고 있다. 현재 약 170만명의 고객이 AI 기반 서비스를 이용 중이다. 카카오뱅크는 12월 중 모임통장에 AI를 적용한 ‘AI 모임총무’ 서비스도 선보일 예정이다. 회비 정리 등 총무 업무를 자동화하는 기능으로, 향후 다른 핵심 금융 상품으로도 AI 적용을 확대할 방침이다.카카오뱅크 관계자는 “은행명이나 계좌번호를 직접 입력하지 않아도 대화만으로 이체를 끝낼 수 있도록 서비스를 설계했다”며 “앞으로도 AI 기술 혁신을 통해 차별화된 금융 경험을 제공하겠다”고 밝혔다.
782 조회
0 추천
2025.11.24 등록
우리은행은 24일 생성형 인공지능 기술을 활용한 ‘AI청약상담원’ 서비스를 선보였다고 밝혔다. 이 서비스는 지난 1월 금융위원회로부터 혁신금융서비스로 지정받아 금융권에서 처음으로 생성형 AI를 청약 상담에 적용한다.24시간 맞춤형 청약 상담 지원AI청약상담원은 챗GPT를 기반으로 24시간 주택청약 상담을 제공한다. 우리원뱅킹 앱의 AI챗봇 메뉴에서 이용할 수 있으며, 로그인과 서비스 이용 동의가 필요하다.이용자가 “내 청약통장으로 지금 청약 순위가 어떻게 되는지 알려줘”라고 질문하면, AI상담원은 보유 청약 계좌의 납입액과 납입회차, 가구 소득, 거주지 정보 등을 자동으로 분석해 예상 청약 가점과 순위, 공급 유형 및 우선 공급 가능 여부까지 한 번에 안내한다. 수십 페이지에 달하는 입주자 모집공고문을 AI가 대신 읽고 핵심 정보를 쉽게 풀어 제공하는 것이 특징이다.RAG 기술로 정확성 강화해당 서비스는 검색증강생성(RAG) 기술을 적용해 청약 전문지식을 반영한 정확한 답변을 생성하도록 설계됐다. 개인정보 필터링과 외부 공격에 대한 방어 체계를 마련해 보안 수준을 강화했으며, 지난 10월 금융보안원 보안대책 평가를 최종 통과했다.우리은행은 ‘AI예적금상담원’과 ‘AI대출상담원’에 이어 이번 AI청약상담원 출시로 AI뱅커 서비스 영역을 지속적으로 확대하고 있다. 우리은행 관계자는 “우리은행이 청약의 모든 궁금증을 해결할 수 있는 대표 채널로 인식될 수 있도록 정확하고 체계적인 청약 상담을 제공하는 것이 목표”라며 “AI 기술을 통해 업계를 선도하는 상담 경험을 만들겠다”고 밝혔다.
825 조회
0 추천
2025.11.24 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입