AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 2026.01.04 14:32
371 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 66 페이지
OpenAI는월요일에ChatGPT의새로운쇼핑리서치기능을출시하여,무료계정부터유료구독까지모든사용자에게블랙프라이데이쇼핑러시직전에제품발견과비교를간소화하도록설계된AI기반쇼핑어시스턴트에대한액세스를제공했습니다.​이기능은OpenAI의커머스분야로의가장과감한진출을나타내며,이미수억명의소비자가제품조사를위해ChatGPT를이용하는수익성높은온라인쇼핑시장에서Amazon및Google과직접경쟁할수있는위치에회사를놓았습니다.온라인쇼핑에대한새로운접근ShoppingResearch는제품검색을대화형상호작용으로전환하여,리뷰사이트,소매업체목록,Reddit과같은커뮤니티포럼에서최신정보를검색하기전에명확한질문을던집니다.사용자는"작은아파트를위한가장조용한무선스틱청소기찾기"와같이자연어로자신의요구사항을설명할수있으며,몇분안에맞춤형구매가이드를받을수있습니다.​이도구는강화학습을사용하여쇼핑작업에특화되도록훈련된GPT-5mini의특수버전으로구동됩니다.OpenAI는이모델이사용자쿼리의모든측면과일치하는항목을정확하게식별하는비율이64%로,이전ChatGPT버전의37%에서향상되었다고주장합니다.이기능은전자제품,뷰티제품,가전제품,스포츠장비와같이세부정보가많은카테고리에서뛰어난성능을발휘합니다.​연휴쇼핑객을지원하기위해OpenAI는시즌내내모든계정유형에서거의무제한사용을제공하고있습니다.사용자는항목을"관심없음"또는"이와유사하게"로표시하여실시간으로검색을개선할수있으며,AI는그에따라추천을조정합니다.​심화되는경쟁이번출시는기술대기업들이AI기반상거래지배를두고경쟁하는가운데이루어졌습니다.지난주아마존은루퍼스(Rufus)쇼핑어시스턴트를업그레이드하여가격이력추적과목표가격에도달하면자동으로상품을구매하는기능을추가했습니다.구글또한11월중순에현지매장에전화해상품재고와가격을확인하는AI등유사한도구들을도입했습니다.​오픈AI의접근방식은단일소매업체의재고가아닌전체웹을스캔하는점에서차별화됩니다.그러나현재이기능은아마존상품목록은제외하며,사용자가아마존사이트에서직접재고를확인하도록안내합니다.오픈AI는추천이"유기적이며광고지원이아닌",특정소매업체를우대하지않는다는점을강조합니다.​현재ShoppingResearch는사용자가구매를위해외부소매업체웹사이트로연결되지만,오픈AI는이미Walmart와Target과의파트너십을맺고있어InstantCheckout기능을통해앱내에서바로결제가가능합니다.이기능은결국새로운도구와통합될예정입니다.​소비자데이터에따르면stakes는상당히높습니다.ChatGPT는이미매일약5천만건의쇼핑관련질의를처리하며,이는25억건의총일일프롬프트중약2%에해당합니다.웹분석기업Similarweb에따르면,ChatGPT는이제Walmart,Etsy,Target등주요소매업체로넘어가는레퍼럴트래픽의20%이상을유도하고있습니다.
673 조회
0 추천
2025.11.25 등록
월트디즈니이미지니어링이월요일차세대로봇올라프캐릭터를공개하며,인공지능과첨단로봇공학을통한생동감넘치는애니메이션캐릭터구현이라는엔터테인먼트거대기업의새로운장을열었다."겨울왕국"의실물크기눈사람은NVIDIA및GoogleDeepMind와의파트너십으로개발된심층강화학습으로구동되는완전한관절구조,대화능력,그리고움직임을특징으로한다.​이로봇캐릭터는2026년봄디즈니랜드파리에서3월29일개장하는월드오브프로즌랜드에서데뷔할예정이며,홍콩디즈니랜드에서도기간한정등장이계획되어있다.월트디즈니이미지니어링의사장겸최고크리에이티브책임자인브루스본(BruceVaughn)과디즈니랜드파리의사장인나타샤라팔스키(NatachaRafalski)가프랑스리조트에서열린기자회견에서이캐릭터를공개했다.​기술혁신올라프로봇은2023년부터스타워즈:갤럭시스엣지에등장한디즈니의BDX드로이드보다한단계도약한것을보여줍니다.로봇처럼보이도록설계된BDX드로이드와달리,올라프는디즈니가물리적으로불가능한방식으로움직이는애니메이션캐릭터를진정성있게재현해야했습니다.​월트디즈니이매지니어링연구개발수석부사장인카일로플린은"올라프는실제세계에서생명을불어넣기훨씬더어려운애니메이션캐릭터입니다"라고말했습니다.이캐릭터는변형가능한"눈"의상,완전히관절로연결된입과눈,탈부착가능한당근코,그리고말하고대화에참여할수있는능력을갖추고있습니다.​디즈니는2025년3월NVIDIAGTC컨퍼런스에서발표된,NVIDIA와구글딥마인드와함께개발한오픈소스시뮬레이션프레임워크인뉴턴을사용하여이캐릭터를개발했습니다.이프레임워크는로봇이시뮬레이션을통해아티스트가제공한동작을학습할수있게하여,디즈니가기계설계와애니메이션사이를빠르게반복할수있도록합니다.​확장계획디즈니랜드파리에서올라프는아렌델베이쇼에등장할예정이며,이는WorldofFrozen랜드의일부로,FrozenEverAfter어트랙션,안나와엘사와의캐릭터만남,그리고식사장소를특징으로합니다.이확장은거의두배의규모로확장될디즈니어드벤처월드(리브랜딩된월트디즈니스튜디오파크)의일부입니다.​"우리가새로운캐릭터를만들고손님들앞에선보일수있는속도는전례가없는수준입니다"라고Laughlin은말했습니다.디즈니는이기술을통해전세계파크와크루즈선에더감정적이고표현력있는캐릭터들을선보일수있을것이라고밝혔습니다.
688 조회
0 추천
2025.11.25 등록
Amazon은월요일,해커들이취약점을악용하기전에이를찾아내기위해경쟁하는인공지능에이전트팀들을배치하는새로운사이버보안방어시스템을공개했으며,이는이거대기술기업이광범위한인프라를보호하는방식에중대한변화를나타낸다.자율위협분석(AutonomousThreatAnalysis)시스템,즉ATA는2024년8월내부해커톤에서시작되었으며,회사가공개하고WIRED가최초로보도한세부사항에따르면이후Amazon의보안운영을위한중요한도구가되었다.단일AI모델에의존하는대신,이시스템은공격자를시뮬레이션하는레드팀으로작동하는전문화된에이전트들과방어를개발하는블루팀을조율하며,모두Amazon의프로덕션시스템을반영하는격리된테스트환경에서기계속도로작동한다.​파이썬공격탐지에서입증된결과이시스템은이미해커들이손상된시스템에대한원격제어를확립하기위해사용하는일반적인기술인Python역방향셸공격을탐지하는데효과성을입증했습니다.ATA의레드팀에이전트는체계적으로37개의역방향셸기술변형을생성하고실행한후,64개의위협변형에대해테스트된개선된탐지규칙을개발했습니다.Amazon의공식발표에따르면,새로운규칙은프로덕션감사데이터에대해검증했을때1.00의완벽한정밀도와재현율점수를달성했습니다.WIRED는별도로이시스템이테스트에서100%효과성에도달했음을확인했습니다.​Amazon의최고보안책임자인SteveSchmidt는WIRED에"초기개념은보안테스트의중요한한계—제한된범위와빠르게진화하는위협환경에서탐지능력을최신상태로유지하는과제—를해결하기위한것이었습니다"라고말했습니다.Amazon에따르면,이시스템은일반적인보안테스트워크플로를수주의수동작업에서약4시간으로단축하여시간을96%줄였습니다.​인간감독하의기계속도이아키텍처는Amazon이"groundedexecution"이라고부르는것을중심으로하며,모든기술과탐지주장은테스트시스템의실제원격측정데이터와타임스탬프가찍힌로그로검증되어야합니다.레드팀에이전트는검증가능한로그를생성하는실제명령을실행하고,블루팀에이전트는실제데이터베이스를쿼리하여제안된방어가작동하는지확인합니다.이는AI환각을방지하기위한설계입니다.​자동화에도불구하고Amazon은"humanintheloop"접근방식을유지하며,프로덕션시스템에배포하기전에보안전문가가모든변경사항을승인하도록요구합니다.2024년해커톤에서ATA를제안한보안엔지니어중한명인MichaelMoran은이시스템을통해보안팀이일상적인테스트작업보다는복잡한과제에집중할수있다고언급했습니다.
691 조회
0 추천
2025.11.25 등록
Aalto대학교의연구진들은전기대신빛을사용하여인공지능계산을처리하는새로운방법을시연했으며,이는AI시스템의확장을제한해온주요병목현상을잠재적으로제거할수있다.​POMMM(ParallelOpticalMatrix-MatrixMultiplication)이라불리는이기술은신경망의수학적기초인복잡한텐서연산을단일통과의가간섭빛으로완료하며,이는11월14일NaturePhotonics에게재된연구에따른것이다.여러번의빛전파를필요로하는기존의광학컴퓨팅방법과달리,POMMM은전체행렬곱셈을동시에수행하여에너지소비를극적으로줄이면서더빠른처리속도로가는길을제공한다.​"여러다른기능을가진여러기계를통해모든소포를검사한다음올바른보관함으로분류해야하는세관직원을상상해보세요"라고Aalto대학교전자및나노공학과의제1저자인Dr.YufengZhang이말했다."우리의광학컴퓨팅방법은모든소포와모든기계를함께병합합니다—우리는각입력을올바른출력에연결하는여러개의'광학고리'를만듭니다.단한번의작업,한번의빛통과로모든검사와분류가즉시그리고병렬로일어납니다."​GPU병목현상해결현재AI시스템은텐서처리속도에한계를겪고있으며,이러한제약으로인해OpenAI,Anthropic,Google,xAI와같은기업들은대규모모델을훈련하고운영하기위해수천개의그래픽처리장치를병렬로실행하고있습니다.GPU는병렬처리에뛰어나지만,상당한전력을소비하고메모리대역폭제약에직면해있습니다.​POMMM프로토타입은이미지인식작업을위한합성곱신경망을실행할때94%이상의정확도를달성했으며,손글씨숫자분류에서94.44%,의류아이템인식에서84.11%의정확도를기록했습니다.이시스템은최대50x50크기의행렬에대해0.15미만의평균절대오차를보였으며,줄당20억회이상의연산효율성을나타냈습니다.​상업적통합으로가는길AaltoUniversity의PhotonicsGroup을이끄는ZhipeiSun교수는이접근법이"거의모든광학플랫폼에구현될수있다"고말했다.Zhang은이기술이3~5년내에주요AI플랫폼에통합될수있을것으로추정한다.​이혁신적발견은AI인프라를위한광학인터커넥트에대한업계의증가하는관심을바탕으로한다.AyarLabs와Lightmatter를포함한기업들은데이터센터병목현상을위한광학솔루션개발에수억달러의벤처캐피털을유치했다.NvidiaCEOJensenHuang은2025년3월에공동패키징된광학기술이네트워킹스위치에대해가능성을보여주지만,직접GPU연결에는전통적인구리연결이"몇배나"더신뢰할수있다고밝혔다.​연구진은POMMM을포토닉칩에직접통합하여광기반프로세서가더낮은전력소비로복잡한AI작업을수행할수있도록할계획이다.
686 조회
0 추천
2025.11.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입