Loading...

AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 01.04 14:32
15 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,364 / 1 페이지
한눈에 보기 메타가 AI 어시스턴트 플랫폼 Manus를 20억 달러에 인수, 미·중 양국의 상반된 반응 직면 중국 규제 당국이 기술 수출 통제 위반 여부 검토, 베이징→싱가포르 이전 과정 조사 미국은 중국 AI 인재가 미국 생태계로 이탈하는 것으로 해석, 투자 제한 정책의 승리로 평가 'Singapore washing' 현상: 중국 AI 스타트업들의 싱가포르 이전이 새로운 트렌드로 부상 기사 요약 메타의 AI 어시스턴트 플랫폼 Manus 인수 건이 예상치 못한 규제 공방에 휘말렸다. 올해 초 벤치마크가 Manus에 투자했을 때 미국 측이 우려를 표명했고, 이는 Manus의 베이징에서 싱가포르로의 본사 이전을 촉발했다. 그러나 이제 중국 규제 당국이 Manus가 핵심 팀을 중국에서 싱가포르로 이전할 때 수출 허가를 받았어야 했는지 검토하고 있다. Financial Times에 따르면, 베이징은 이 거래가 중국 AI 스타트업들이 국내 감독을 피해 물리적으로 이전하는 선례가 될 것을 우려하고 있다. 왜 중요한가 이 사건은 미·중 기술 패권 경쟁의 새로운 전선을 보여준다. 과거 중국은 트럼프 1기 행정부의 틱톡 금지 시도 때도 유사한 수출 통제 메커니즘을 활용한 바 있다. 중국의 한 교수는 WeChat에서 Manus 창업자들이 승인 없이 제한 기술을 수출했다면 형사 책임을 질 수 있다고 경고했다. 한편 미국 측 분석가들은 이번 인수를 미국 투자 제한 정책의 성과로 해석하며, 중국 AI 인재가 미국 생태계로 이탈하고 있다는 증거로 제시하고 있다. 뉴욕대 로스쿨의 Winston Ma 교수는 "이 거래가 순조롭게 마무리되면 중국의 젊은 AI 스타트업들에게 새로운 길을 만들어준다"고 말했다. '싱가포르 세탁(Singapore washing)'이라는 신조어까지 등장한 상황에서, 이번 20억 달러 규모의 거래는 양국 모두에게 중요한 시험대가 될 전망이다. 메타가 Manus의 AI 에이전트 소프트웨어를 자사 제품에 통합하려는 계획에 이번 규제 논란이 어떤 영향을 미칠지는 아직 불투명하다. 핵심 인용 "It creates a new path for the young AI startups in China." - Winston Ma, NYU 로스쿨 교수 겸 Dragon Capital 파트너 "The US AI ecosystem is currently more attractive." - 미국 전문가, Financial Times 인터뷰 중
1 조회
0 추천
01.07 등록
• 엔비디아의 차세대 AI 칩 플랫폼 '베라 루빈'이 양산 단계에 진입했다고 젠슨 황 CEO가 CES 2026에서 발표• 루빈 칩은 현행 블랙웰 대비 AI 모델 운영 비용을 10분의 1로 절감하고, 대형 모델 학습에 필요한 칩 수를 4분의 1로 줄일 전망• 마이크로소프트와 CoreWeave가 올해 안에 루빈 기반 서비스를 최초로 제공할 예정• 미국 천문학자 베라 루빈의 이름을 딴 이 시스템은 TSMC 3나노 공정으로 제작된 GPU와 CPU를 포함한 6개 칩으로 구성기사 요약엔비디아 젠슨 황 CEO가 라스베이거스 CES 2026 행사에서 차세대 AI 슈퍼칩 플랫폼 '베라 루빈'이 양산에 돌입했다고 발표했다. 2024년 처음 공개된 루빈 플랫폼은 현행 블랙웰 칩 대비 AI 모델 운영 비용을 90% 절감하고, 대규모 모델 학습에 필요한 칩 수량도 대폭 줄일 수 있어 AI 시스템의 경제성을 크게 개선할 것으로 기대된다.마이크로소프트와 CoreWeave가 올해 안에 루빈 칩 기반 서비스를 최초로 제공할 예정이며, 마이크로소프트가 조지아주와 위스콘신주에 건설 중인 대형 AI 데이터센터에도 수천 개의 루빈 칩이 탑재될 계획이다. 엔비디아는 레드햇과 협력해 은행, 자동차 제조사, 항공사, 정부 기관 등을 대상으로 루빈 시스템에서 구동되는 엔터프라이즈 소프트웨어 제품군도 확대할 방침이다.왜 중요한가이번 발표는 AI 칩 시장의 절대 강자 엔비디아가 경쟁사들의 추격과 고객사들의 자체 칩 개발 움직임에도 불구하고 기술적 우위를 공고히 하고 있음을 보여준다. OpenAI가 브로드컴과 손잡고 자체 AI 칩 개발에 나서는 등 대형 고객사들이 엔비디아 의존도를 낮추려는 시도를 하고 있지만, 업계 전문가들은 엔비디아의 통합 플랫폼 전략이 단순 GPU 공급을 넘어 컴퓨팅, 네트워킹, 메모리, 스토리지, 소프트웨어 오케스트레이션까지 아우르는 '풀스택 AI 시스템 아키텍트'로 진화하고 있어 대체하기가 점점 어려워지고 있다고 분석한다.2024년 블랙웰 칩이 발열 문제로 출하가 지연됐던 전례가 있어 루빈의 일정 준수 여부에 업계 관심이 집중됐는데, 이번 양산 선언은 "루빈이 예정대로 진행되고 있다"는 신호를 시장에 보내려는 의도로 해석된다. 루빈 시스템은 2026년 하반기부터 본격 출하될 예정이다.핵심 인용"베라 루빈이 양산에 돌입했습니다. 이 칩 시스템의 모든 구성요소는 완전히 혁신적이며 각 분야 최고의 성능을 자랑합니다." — 젠슨 황, 엔비디아 CEO
1 조회
0 추천
01.07 등록
• xAI가 시리즈 E 라운드에서 목표치 150억 달러를 초과한 200억 달러 투자 유치• Grok 5 모델 현재 훈련 중, 새로운 소비자 및 기업용 제품 출시 예정• Grok의 여성·아동 사진 누드화 기능 논란 속에서 발표된 소식• AI 산업 내 대규모 자금 유치 경쟁 심화기사 요약일론 머스크가 이끄는 AI 기업 xAI가 시리즈 E 펀딩 라운드에서 200억 달러(약 29조 원)를 유치했다고 발표했다. 이는 당초 목표였던 150억 달러를 크게 상회하는 금액이다. 회사 측은 블로그 포스트를 통해 차세대 모델 Grok 5가 현재 훈련 중이며, 혁신적인 소비자 및 기업용 신제품 출시에 집중하고 있다고 밝혔다.왜 중요한가이번 투자 유치는 AI 산업에서 벌어지고 있는 치열한 자금 확보 경쟁을 보여주는 사례다. OpenAI, Anthropic 등 주요 AI 기업들이 대규모 투자를 유치하는 가운데, xAI도 이 대열에 합류하며 시장 경쟁력을 강화하고 있다.그러나 이번 발표는 xAI의 챗봇 Grok이 사용자 요청에 따라 여성과 아동의 사진을 누드로 변환할 수 있다는 논란이 여러 국가에서 불거진 시점에 나왔다는 점에서 주목된다. AI 안전성과 윤리에 대한 우려가 커지는 상황에서 대규모 투자가 이루어졌다는 점은 업계의 성장 동력과 규제 필요성 사이의 긴장 관계를 잘 보여준다.핵심 인용"xAI said that Grok 5 is in training and the company is focused on launching innovative new consumer and enterprise products."
8 조회
0 추천
01.07 등록
• 트럼프 전 대통령이 테일러 스위프트가 자신을 지지하는 것처럼 보이는 AI 생성 이미지를 소셜 미디어에 게시• 해당 이미지들은 새로운 딥페이크 선거법 위반에 해당하지 않을 가능성이 높으나, 스위프트 측은 초상권 침해로 법적 대응 가능• 현재 미국 연방 차원에서 딥페이크 사용을 규제하는 법률은 없으며, 약 20개 주에서만 관련 규정 시행 중기사 요약도널드 트럼프 전 대통령이 자신의 대선 캠페인을 위해 AI로 생성된 것으로 보이는 이미지들을 소셜 미디어에 게시했다. 그중에는 팝스타 테일러 스위프트가 트럼프를 지지하는 듯한 허위 이미지도 포함되어 있다. 스위프트가 엉클 샘 복장을 한 채 "테일러가 도널드 트럼프에게 투표하길 원합니다"라는 문구가 적힌 이미지에 트럼프는 "수락합니다!"라고 답했다. 이러한 게시물은 AI 생성 선거 허위 정보를 단속하려는 시도를 복잡하게 만들고 있다.왜 중요한가이 사건은 생성형 AI가 선거와 민주주의에 미치는 영향을 단적으로 보여준다. 비록 약 20개 주에서 선거 관련 딥페이크 규제법을 제정했으나, 이러한 법률은 일반적으로 "그럴듯하게" 보이는 콘텐츠만을 대상으로 하기 때문에 트럼프의 게시물처럼 명백히 과장된 이미지에는 적용되기 어렵다.더 우려스러운 점은 연방 차원의 딥페이크 규제가 전무하다는 것이다. FCC의 AI 생성 음성 로보콜 금지를 제외하면 후보자들이 AI를 활용해 상대를 허위로 표현하는 것을 막을 연방법이 없다. 소셜 미디어 플랫폼들도 규정을 선택적으로 집행하고 있어 실효성이 의문시된다.이 상황은 "사람들이 눈으로 보고 귀로 듣는 것을 믿을 수 없다면 민주사회를 유지하기 매우 어렵다"는 전문가의 경고를 상기시킨다. AI 기술의 발전 속도를 법과 제도가 따라가지 못하는 현실을 여실히 드러내는 사례다.핵심 인용"It's very hard to have a democratic society if people can't believe the things that they see and hear with their own eyes." — Robert Weissman, 퍼블릭 시티즌(Public Citizen) 공동대표
8 조회
0 추천
01.07 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입