Loading...

AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 2026.01.04 14:32
768 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 6 페이지
Executive Summary • 트럼프 행정부가 운영하는 Realfood.gov 사이트에 일론 머스크의 AI 챗봇 Grok이 도입되어 식품 관련 질문에 답변 제공 • Grok의 단백질 섭취 권장량이 RFK 주니어가 주장하는 새 식이 가이드라인과 상충하는 것으로 확인 • 영양학 전문가들은 정부 사이트에 AI 도구를 통합하는 것이 시기상조라고 경고 Background 보건복지부 장관 로버트 F. 케네디 주니어가 추진 중인 'MAHA(Make America Healthy Again)' 캠페인의 일환으로, 정부는 Realfood.gov 웹사이트를 통해 새로운 식이 가이드라인을 홍보하고 있다. 해당 사이트는 "진짜 음식에 대한 진짜 답변"을 얻기 위해 일론 머스크의 AI 챗봇 Grok 사용을 권장하고 있으나, 정작 Grok의 답변이 행정부의 공식 입장과 모순되는 상황이 발생했다. Impact & Implications 정책 메시지의 일관성 문제 트럼프 행정부의 새 식이 가이드라인은 기존보다 높은 단백질 섭취량(체중 1kg당 1.2~1.6g)을 권장하며 "단백질과의 전쟁을 끝낸다"고 선언했다. 그러나 Grok에게 동일한 질문을 했을 때, AI는 미국 의학연구소의 기존 권장량인 체중 1kg당 0.8g을 제시했다. 이는 정부가 자체 웹사이트에서 홍보하는 AI 도구가 정부 방침과 다른 정보를 제공하는 아이러니한 상황을 만들어냈다. AI 신뢰성에 대한 우려 등록 영양사 제시카 크누릭은 "AI는 많은 것을 틀리게 말한다"며 정부 웹사이트에 이런 기술을 통합하는 것이 시기상조라고 지적했다. Grok은 RFK 주니어 본인이 권장하는 육류와 발효식품 중심 식단에 대해서도 "괴혈병 유사 증상", 변비, 통풍 등의 부작용 가능성을 경고했다. 공중보건 커뮤니케이션의 혼란 위스콘신-밀워키 대학의 미셸 킹 라이머 교수는 "메시지의 불일치가 대중이 자신의 건강에 실제로 중요한 것이 무엇인지 이해하기 어렵게 만든다"고 우려를 표명했다. 행정부가 "모든 식사에서 단백질을 우선시하라"고 강조하는 반면, Grok은 붉은 고기와 가공육 섭취를 제한하거나 최소화하라고 조언하는 등 혼선이 가중되고 있다. Key Data & Facts 항목수치/내용 새 가이드라인 단백질 권장량체중 1kg당 1.2~1.6g 기존 RDA 권장량체중 1kg당 0.8g 미국인 평균 단백질 섭취량체중 1kg당 약 1g (총 에너지의 15%) AI 도구일론 머스크의 Grok 홍보 방식슈퍼볼 광고 (마이크 타이슨 출연) Key Quote "AI는 많은 것을 틀리게 말합니다. 정부 웹사이트에 이런 것을 통합하는 것은 시기상조라고 생각합니다." — 제시카 크누릭, 등록 영양사 겸 공중보건 커뮤니케이터
428 조회
0 추천
2026.02.11 등록
Executive Summary • 뉴욕주에서 지난 11개월간 160여 개 기업이 대량 해고 신고서를 제출했으나, AI나 자동화를 해고 사유로 선택한 기업은 단 한 곳도 없었다 • 골드만삭스, 아마존, 모건스탠리 등 AI 도입에 적극적인 기업들도 공식 서류에는 AI 관련 해고를 인정하지 않았다 • 전문가들은 기업들이 AI 해고를 인정할 경우 평판 손상을 우려하거나, 기술 변화에 따른 조직 개편에 수십 년이 걸리기 때문에 추적이 어렵다고 분석했다 Background 뉴욕주 캐시 호철(Kathy Hochul) 주지사는 AI가 고용 시장에 미치는 실질적 영향을 파악하기 위해 2025년 3월부터 WARN(Worker Adjustment and Retraining Notification) 신고서에 '기술 혁신 또는 자동화' 항목을 추가하도록 노동부에 지시했다. 뉴욕은 이러한 AI 관련 해고 사유 선택지를 제공하는 첫 번째 주가 되었다. Impact & Implications 기업 투명성의 한계 162개 기업, 약 28,300명의 근로자에 영향을 미친 750건 이상의 해고 신고서가 제출되었지만, AI를 사유로 선택한 기업은 전무했다. 골드만삭스는 내부적으로 AI의 생산성 향상 잠재력을 해고와 연계했고, 아마존도 AI 혜택이 인력 감축으로 이어질 것이라고 사전 경고했음에도 공식 서류에는 이를 기재하지 않았다. 이는 기업들이 AI 해고를 공개적으로 인정하는 것에 대한 평판 리스크를 심각하게 고려하고 있음을 시사한다. 규제 강화 움직임 뉴욕주 해리 브론슨(Harry Bronson) 의원은 두 가지 법안을 발의했다. 첫째, 100명 이상 고용 기업에 AI로 인한 미충원 직책 수와 근무시간 변동을 연간 보고하도록 의무화하는 법안이다. 둘째, 일자리를 컴퓨터에 이전하는 더 광범위한 기업에 적용되는 WARN 유사 절차를 도입하고, 미신고 시 주정부 보조금과 세제 혜택 자격을 박탈하는 법안이다. 데이터 수집의 근본적 한계 코넬대학교 노동경제학자 에리카 그로센(Erica Groshen)은 기업들이 신기술의 영향에 대한 질문에 답하기 어려울 것이라고 지적했다. 그녀는 "솔직히 AI에 의해 대체되든 일반적인 경쟁 시장에 의해 대체되든 우리가 정말 신경 써야 할까?"라며, 입법자들이 해야 할 일은 "사람들에게 올바른 전환을 할 수 있는 정보를 제공하는 것"이라고 강조했다. Key Data & Facts 항목수치/내용 조사 기간2025년 3월~2026년 1월 (약 11개월) 해고 신고서 제출 기업 수162개 영향받은 근로자 수약 28,300명 AI를 해고 사유로 선택한 기업0개 골드만삭스 영향 근로자4,100명 이상 아마존 영향 근로자660명 미신고 시 벌금일당 500달러 2024년 AI 귀인 해고 기업 수 (전국)약 55,000개 Key Quote "솔직히 AI에 의해 대체되든 일반적인 경쟁 시장에 의해 대체되든 우리가 정말 신경 써야 할까? 사람들에게 올바른 전환을 할 수 있는 정보를 제공하는 것이 입법자들이 해야 할 일이다." — 에리카 그로센, 코넬대학교 노동경제학 교수
429 조회
0 추천
2026.02.10 등록
Executive Summary • 미 보건복지부(HHS)가 백신 모니터링 데이터베이스에서 패턴을 찾아 백신 부작용에 대한 가설을 생성하는 생성형 AI 도구 개발 중 • 2023년 말부터 개발 시작됐으나 아직 배포되지 않은 상태로, 케네디 보건장관의 반백신 기조와 맞물려 우려 제기 • 전문가들 "LLM은 환각 현상이 있어 반드시 후속 검증 필요" 경고 • VAERS 데이터는 검증되지 않은 자가 보고 방식으로, AI 분석 결과를 단독 근거로 삼기엔 한계 Background 백신부작용보고시스템(VAERS)은 1990년 CDC와 FDA가 공동으로 설립한 백신 안전성 모니터링 시스템이다. 의료진이나 일반인 누구나 이상반응을 신고할 수 있지만, 신고 내용이 별도로 검증되지 않는다는 한계가 있다. 이러한 데이터를 분석해 가설을 도출하려는 시도는 이전부터 있었으나, 대규모 언어모델(LLM) 기반의 생성형 AI를 본격 도입하려는 것은 이번이 처음이다. 백신 회의론자로 알려진 로버트 F. 케네디 주니어 보건장관 취임 이후, 이 도구의 활용 방향에 대한 우려가 커지고 있다. Impact & Implications AI 기술의 한계와 위험 전문가들은 LLM이 그럴듯한 환각(hallucination)을 생성하는 것으로 유명하다고 지적했다. 조지타운대 감염병 전문의 제시 굿맨 교수는 "접근 방식에 따라 많은 거짓 경보가 발생할 것으로 예상되며, 백신과 가능한 이상반응을 이해하고 통계, 역학, LLM 출력의 문제점을 파악하는 숙련된 인력의 후속 검토가 필수"라고 강조했다. CDC 인력이 대폭 축소된 상황에서 AI 생성 데이터를 제대로 검토할 역량이 있는지도 의문이다. 정치적 맥락과 우려 케네디 장관은 취임 후 코로나19, 인플루엔자, A·B형 간염 등 여러 백신을 아동 필수 접종 목록에서 제외했다. FDA 생물학적제제평가연구센터의 비나이 프라사드 소장은 최근 내부 메모에서 증거 인용 없이 코로나19 백신으로 최소 10명의 아동이 사망했다고 주장한 것으로 알려졌다. 전직 FDA 위원장 12명 이상이 뉴잉글랜드의학저널에 "선택적 증거의 재해석에 기반해 백신 규제를 극적으로 변경할 것"이라며 우려를 표명했다. VAERS 데이터의 본질적 한계 필라델피아 아동병원 백신교육센터장 폴 오핏 박사는 "VAERS는 기껏해야 가설 생성 메커니즘"이라며 "누구나 보고할 수 있고 대조군이 없는 시끄러운 시스템"이라고 설명했다. 백신 접종 후 발생한 이상반응을 보여줄 뿐, 백신이 그 반응을 유발했다는 인과관계를 증명하지는 못한다. 그럼에도 반백신 활동가들은 오랫동안 VAERS 데이터를 백신 위험성의 근거로 오용해왔다. Key Data & Facts 항목수치/내용 AI 도구 개발 시작2023년 말 현재 상태미배포 (개발 중) VAERS 설립1990년 (CDC·FDA 공동 운영) 케네디 장관 취임 후 제외된 백신코로나19, 인플루엔자, A·B형 간염, 수막구균, 로타바이러스, RSV 등 전직 FDA 위원장 반대 서한 서명자12명 이상 Key Quote "VAERS는 기껏해야 가설 생성 메커니즘이다. 누구나 보고할 수 있고 대조군이 없는 시끄러운 시스템이다." — 폴 오핏, 필라델피아 아동병원 백신교육센터장
472 조회
0 추천
2026.02.09 등록
Executive Summary • 2025년 4분기 기준, 웹사이트 방문 31건 중 1건이 AI 스크래핑 봇에서 발생 — 연초 대비 6배 이상 증가 • AI 봇의 robots.txt 무시 비율 400% 급증, 웹사이트들의 차단 시도도 336% 증가 • AI 에이전트 트래픽이 인간 사용자와 거의 구분 불가능한 수준에 도달 • 인터넷의 미래가 '인간 중심'에서 '자율 AI 봇 중심'으로 전환될 가능성 대두 Background OpenClaw(구 Moltbot, 그 이전 Clawdbot)와 같은 바이럴 가상 비서의 등장은 인터넷 생태계의 근본적 변화를 상징한다. 웹이 더 이상 인간만의 공간이 아니라 자율 AI 봇이 지배하는 공간으로 변모할 수 있다는 전망이 나오고 있다. 인터넷 인프라 기업 Akamai와 웹 스크래핑 추적 기업 TollBit이 발표한 새로운 보고서는 AI 봇이 이미 웹 트래픽의 상당 부분을 차지하고 있음을 보여준다. Impact & Implications 산업/시장 영향 TollBit 보고서에 따르면 2025년 4분기 기준 고객 웹사이트 방문 31건 중 1건이 AI 스크래핑 봇에서 발생했다. 1분기에는 200건 중 1건에 불과했던 것과 비교하면 급격한 증가세다. 더 주목할 점은 13% 이상의 AI 봇 요청이 robots.txt를 무시하고 있으며, 이 비율이 2분기에서 4분기 사이 400% 증가했다는 것이다. 동시에 AI 봇을 차단하려는 웹사이트도 336% 증가했다. Akamai CTO 로버트 블루모페(Robert Blumofe)는 "AI가 우리가 아는 웹을 변화시키고 있다"며 "그에 따른 군비경쟁이 웹의 미래 모습, 느낌, 기능성, 그리고 비즈니스의 기본을 결정할 것"이라고 경고했다. 기술적 의미 AI 봇들의 스크래핑 기술이 점점 정교해지고 있다. 일부 봇은 일반 웹 브라우저에서 오는 것처럼 트래픽을 위장하거나, 인간이 웹사이트와 상호작용하는 방식을 모방하는 요청을 보낸다. TollBit 연구에 따르면 일부 AI 에이전트의 행동은 이제 인간 웹 트래픽과 거의 구분이 불가능한 수준에 이르렀다. 한편 AI 훈련 목적의 봇 트래픽은 지난 7월 이후 꾸준히 증가하고 있으며, AI 에이전트가 웹 콘텐츠를 실시간으로 가져오는 활동도 상승세다. 챗봇과 AI 도구들이 실시간 정보(제품 가격, 영화 상영 시간, 최신 뉴스 요약 등)를 웹에서 가져와 출력을 개선하는 데 활용하고 있기 때문이다. 향후 전망 TollBit CEO 토싯 파니그라히(Toshit Panigrahi)는 "인터넷의 대부분이 미래에 봇 트래픽이 될 것"이라며 "이것은 단순한 저작권 문제가 아니라, 인터넷에 새로운 방문자가 등장하고 있는 것"이라고 강조했다. 웹사이트들이 AI 스크래퍼에게 콘텐츠 접근료를 부과하거나, AI 에이전트를 차단하는 대신 콘텐츠를 노출시키는 '생성 엔진 최적화(GEO)' 전략이 새로운 마케팅 채널로 부상하고 있다. Brandlight의 우리 가프니(Uri Gafni)는 "2026년에 이것이 검색, 광고, 미디어, 커머스가 융합하는 완전한 마케팅 채널로 전개될 것"이라고 전망했다. Key Data & Facts 항목수치/내용 AI 봇 방문 비율 (2025년 4분기)31건 중 1건 AI 봇 방문 비율 (2025년 1분기)200건 중 1건 robots.txt 무시 비율 증가400% (2분기→4분기) AI 봇 차단 시도 증가336% (연간) AI 스크래핑 기업 수40개 이상 봇 관련 소송Meta·X vs Bright Data (기각/취하) Key Quote "인터넷의 대부분이 미래에 봇 트래픽이 될 것이다. 이것은 단순한 저작권 문제가 아니다. 인터넷에 새로운 방문자가 등장하고 있는 것이다." — 토싯 파니그라히(Toshit Panigrahi), TollBit CEO
463 조회
0 추천
2026.02.08 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입