AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 2026.01.04 14:32
401 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 74 페이지
Allen Institute for AI (Ai2)는 OLMo 3를 출시했으며, 이는 7B 및 32B 언어 모델 제품군으로, 경쟁사들이 이러한 구성 요소를 공개하지 않는 것과 대조적으로 훈련 데이터, 코드, 중간 체크포인트 및 훈련 로그에 대한 완전한 접근을 제공하는 최초의 완전 공개 32B 추론 모델이라고 설명합니다.OLMo 3-32B는 6배 적은 토큰으로 훈련되면서도 추론 벤치마크 전반에 걸쳐 Qwen3-32B와 비교할 만한 성능을 달성하여, 지도 미세 조정, 선호도 최적화 및 강화 학습 파이프라인을 통해 가능한 효율성 향상을 입증합니다.이 프로젝트에는 60명 이상의 저자가 참여했으며 65,000개 토큰 컨텍스트 창을 지원하여, 훈련 데이터 공개에 대한 규제 압력이 증가하는 가운데 AI 시스템의 투명성을 추구하는 기업 및 연구 사용자를 위한 모델로 자리매김하고 있습니다.
847 조회
0 추천
2025.11.23 등록
서바이벌 게임 DayZ의 제작자이자 Rocketwerkz의 CEO인 Dean Hall은 게임 개발의 미래에 대해 대담한 예측을 내놓았습니다: 전통적인 게임 엔진이 아닌 프레임워크가 업계를 지배할 것이라는 것입니다. Game Developer와의 인터뷰에서 Hall은 우주 시뮬레이션 게임 Kitten Space Agency를 위해 특별히 제작된 자신의 스튜디오의 커스텀 C# 프레임워크 Brutal이 개발자들이 게임 제작에 접근하는 방식의 근본적인 변화를 대표한다고 설명했습니다.이 예측은 수년간 게임 개발의 표준이었던 Unity와 Unreal Engine과 같은 비주얼 스크립팅 도구의 현재 지배력에 도전장을 내밉니다. Hall은 ChatGPT와 같은 대형 언어 모델이 언어 기반 코딩을 더 접근 가능하게 만들어, 비주얼 기반 스크립팅의 주요 이점을 잠재적으로 제거할 수 있다고 주장합니다. “LLM이 언어 기반 코딩을 더 접근 가능하게 만든다면, 비주얼 기반 스크립팅은 그 우위를 잃게 됩니다”라고 Hall은 설명했습니다.첫 번째 원리로부터 구축하기“최신 .NET 기능을 사용하면서 Vulkan 그래픽 API를 포함한 고성능 C++ 라이브러리 및 도구에 대한 저수준 API 액세스를 제공하는” 도구로 설명되는 Brutal은 기존 엔진들이 효율적으로 해결할 수 없었던 특정 기술적 과제를 해결하기 위해 만들어졌습니다. 이 프레임워크는 개발자들이 게임 시스템을 처음부터 구축할 수 있게 하여, “어떻게 할 것인가?“보다 “무엇을 하려고 하는가?“를 먼저 물을 수 있도록 합니다.Kerbal Space Program의 제작자인 Felipe Falanghe와 함께 작업하면서, Hall의 Rocketwerkz 팀은 약 1년 만에 Kitten Space Agency 알파 전체를 구축했습니다. 11월 13일에 공개 프리 알파를 출시한 이 게임은 카메라가 0-0-0에 고정되어 있고 모든 것이 카메라를 기준으로 그려지는 맥락적 렌더링(contextual rendering)을 사용하는데, 이는 Unity나 Unreal과 같은 씬 기반 엔진에서는 구현하기 어려운 기법입니다.문서화 보조 도구로서의 LLMsHall과 Falanghe는 LLM이 프레임워크 워크플로우를 실행 가능하게 만들었다고 평가하지만, 일반적으로 AI 코딩 도구와 연관된 방식은 아니라고 말한다. “vibe coding”을 통해 코드를 생성하는 대신, 개발자들은 LLM을 사용하여 C# 라이브러리와 Vulkan에 대한 문서에 빠르게 접근함으로써 수 시간의 수동 조사를 건너뛸 수 있다. Hall은 LLM이 잘 정의된 프로그래밍 언어를 어떻게 처리하는지를 언급하며 “고도로 구조화된, 사실상 잔인할 정도로 구조화된 언어보다 더 나은 것이 무엇이 있겠습니까?“라고 말했다.이러한 예측에도 불구하고, Hall은 Brutal이 만능 솔루션이 되도록 의도된 것은 아니라고 강조했다. 이 프레임워크는 Ahwoo라는 상업적 법인을 통해 오픈 소스로 제공될 예정이지만, Hall은 다른 사람들이 유사한 원칙을 따르는 다른 프레임워크를 만들 것으로 기대한다. 그는 “저는 Brutal이 만능 주머니칼이 되는 것을 좋아하지 않습니다. 왜냐하면 그것이 사실이라고 생각하지 않기 때문입니다”라고 말했다.
807 조회
0 추천
2025.11.23 등록
보안 연구원들은 이번 주 AI 기반 침투 테스트 도구의 크랙 버전이 2026년 사이버 범죄 포럼에서 확산될 것으로 예상되며, 이를 통해 공격자들이 전례 없는 속도로 취약점을 발견하고 악용할 수 있게 될 것이라는 강력한 경고를 발표했습니다. 목요일에 게시된 이 경고는 정당한 보안 도구가 Cobalt Strike와 유사하게 무기화될 수 있다는 우려가 커지고 있음을 강조하며, 이는 위협 행위자들이 공격 일정을 며칠에서 몇 분으로 단축할 수 있게 할 가능성이 있습니다.AI 도구가 인간 해커를 앞지르다AI 기반 침투 테스트 플랫폼은 취약점 발견에서 인간 보안 전문가를 능가하는 능력을 입증했습니다. 주요 버그 바운티 플랫폼에서 1위를 차지한 Xbow 도구는 주요 시스템 전반에 걸쳐 원격 코드 실행 및 SQL 인젝션 취약점을 포함한 수많은 보안 결함을 발견했습니다. ReliaQuest 위협 연구원에 따르면 온라인 포럼의 증거는 사이버 범죄자들이 이미 불법 AI 도구를 구축하기 위해 개발자를 모집하고 있음을 나타냅니다.크랙 버전이 온라인에 등장한 후 광범위하게 악용된 합법적인 레드팀 도구인 Cobalt Strike가 설정한 선례는 이러한 신흥 AI 제품에 대해 유사한 궤적을 시사합니다. 연구원들은 크랙 복사본을 통해 고급 AI 도구가 널리 사용 가능해지면 공격이 빠르게 전개될 수 있다고 경고합니다. 최근 데이터에 따르면 랜섬웨어 서비스형(ransomware-as-a-service) 그룹이 AI 기반 기능을 통합함에 따라 공격자의 “탈출 시간”은 이미 2024년 48분에서 2025년 중반 단 18분으로 급감했습니다.코드 보안 우려 증가이러한 위협들이 가중되는 가운데, 연구에 따르면 AI가 생성한 코드의 최대 45%가 보안 취약점을 포함하고 있는 것으로 나타났습니다. 80개의 코딩 작업에 걸쳐 100개 이상의 대규모 언어 모델을 분석한 Veracode 연구에서는 안전한 방법과 안전하지 않은 방법 중 선택해야 할 때 AI 모델이 45%의 경우에 안전하지 않은 옵션을 선택한 것으로 밝혀졌습니다. Java는 72%의 보안 실패율로 가장 높은 위험도를 보였으며, Python, C# 및 JavaScript는 38-45%의 실패율을 나타냈습니다.보안 전문가들은 또한 오픈소스 소프트웨어에 대한 위험이 증가하고 있다고 경고했는데, 약 1,200만 개에 달하는 프로젝트 중 절반 이상이 단일 자원봉사자에 의해 관리되고 있습니다. 2025년의 주목할 만한 사건들에서는 유지관리자들이 피싱 사기의 희생양이 되어 범죄자들이 널리 사용되는 리포지토리에 악성 코드를 게시할 수 있게 되었으며, 이는 수백 개의 애플리케이션과 수백만 명의 사용자에게 잠재적으로 영향을 미쳤습니다.이러한 경고는 Qilin, Akira, DragonForce를 포함한 랜섬웨어 그룹들이 운영을 강화하는 가운데 나왔으며, 일부는 시끄럽고 공격적인 전술을 수용하는 반면 다른 그룹들은 법 집행 기관의 개입을 피하기 위해 은밀한 접근 방식을 유지하고 있습니다.
833 조회
0 추천
2025.11.23 등록
HD현대가 미국의 인공지능(AI) 방산 기업 안두릴 인더스트리와 손잡고 자율 무인수상함(ASV) 시장에 본격 진출한다. 양사는 23일 최근 서울 중구 웨스틴 조선호텔에서 ASV의 설계·건조 및 AI 솔루션 공급 계약을 체결했다고 밝혔다.계약 체결식에는 HD현대중공업 주원호 사장과 안두릴의 공동설립자 팔머 럭키가 참석했다. 양사는 2026년까지 시제함 개발과 건조를 완료하고 미국 및 글로벌 시장 선점에 나선다는 계획이다.역할 분담과 기술 융합HD현대는 울산 HD현대중공업에서 ASV를 건조하고, 개발 중인 선박 자율운항 기술 등 주요 AI 솔루션을 공급한다. 안두릴은 자율 임무 수행 솔루션을 탑재해 양사의 핵심 기술을 결합한다.이번 협력은 올해 8월 체결한 함정 개발 협력 합의각서(MOA)를 구체화한 것이다. 당시 양사는 한국 시장에서 HD현대가 개발 중인 무인수상정에 안두릴의 자율 임무 수행 체계를 탑재하고, 미국 시장에서는 안두릴이 주도하는 유·무인 함정에 HD현대가 설계·건조와 AI 자율화 기술을 공급하기로 했다.급성장하는 무인함정 시장미국 시장조사기관 얼라이드 마켓 리서치에 따르면, 세계 무인 수상정 시장은 2022년 9억2000만 달러에서 연평균 11.5% 성장해 2032년 27억 달러 규모에 달할 전망이다.주원호 HD현대중공업 사장은 “한국과 미국의 방산업체가 협력해 함정을 공동 개발하는 새로운 전기가 될 것”이라며 “세계 최고의 AI 방산 기업과 세계 최고의 조선소가 협력해 전 세계 해군이 추진하고 있는 유무인 복합체계 도입에도 앞장서겠다”고 말했다.팔머 럭키 안두릴 공동설립자는 “세계 최고 수준의 설계·건조 역량을 갖춘 HD현대의 울산 야드에서 우리의 첫 번째 ASV를 짓게 돼 기쁘게 생각한다”며 “앞으로도 미국과 한국을 포함한 전 세계 방산 시장에서 HD현대와의 더 큰 협력도 기대한다”고 말했다. 정기선 HD현대 회장은 지난 10월 APEC CEO 서밋에서 “양사의 역량이 결집된 선박 자율운항 기술과 자율 임무 수행이 융합되면 해군 작전의 패러다임을 완전히 바꿔나갈 것”이라고 전망했다.
792 조회
0 추천
2025.11.23 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입