AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 2026.01.04 14:32
394 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 68 페이지
도널드트럼프미국대통령이24일(현지시간)인공지능개발을가속화하는대규모국가프로젝트'제네시스미션(GenesisMission)'출범을위한행정명령에서명했다.백악관은이번이니셔티브를아폴로프로그램이후연방과학자원의최대동원이라고평가하며,맨해튼프로젝트에필적하는긴급성과야망을가진국가적노력이라고강조했다.​마이클크라치오스백악관과학기술정책실장은기자들에게"제네시스미션은아폴로프로그램이후연방과학자원의최대동원"이라고밝혔다.그는"방대한연방데이터세트,첨단슈퍼컴퓨팅성능,세계적수준의과학시설을결합함으로써제네시스미션은AI를활용해실험설계를자동화하고,시뮬레이션을가속하며,단백질접힘부터핵융합플라스마역학에이르기까지모든분야를위한예측모델을만들어낼것"이라고설명했다.​에너지부주도로통합AI플랫폼구축행정명령은에너지부장관크리스라이트에게17개국립연구소의슈퍼컴퓨터와연방과학데이터세트를활용한통합AI플랫폼구축을지시한다.이플랫폼은과학기초모델을훈련하고,새로운가설을검증하며,연구흐름을자동화하는AI에이전트를창출할예정이다.​백악관은엔비디아,델,AMD,HPE,오라클등주요기업들과의협력을통해슈퍼컴퓨팅역량을강화할계획이다.에너지부는최근아르곤국립연구소에엔비디아블랙웰GPU10만개를탑재한'솔스티스'시스템을포함해여러대의새로운AI슈퍼컴퓨터구축을발표했다.​중국과의AI경쟁대응트럼프대통령은행정명령에서"오늘날미국은과학적발견과경제성장의가장중요한최첨단영역인AI개발분야에서글로벌기술주도권경쟁을벌이고있다"고강조했다.그는"이중대한순간에우리가직면한도전은2차세계대전에서우리가승리하는데중요했던맨해튼프로젝트의긴급성과야망에비교할만한역사적인국가적노력을요구한다"고말했다.​라이트에너지부장관은"AI경쟁에서승리하려면미국기술과과학이제공하는가장뛰어난인재와산업을하나로모으는혁신적인파트너십이필요하다"고밝혔다.제네시스미션은질병치료,에너지,국가안보를포함한다양한분야에서과학적발견을극적으로가속화하는것을목표로한다.크라치오스실장은이를통해"발견타임라인을수년에서수일또는수시간으로단축"할수있을것이라고전망했다.
716 조회
0 추천
2025.11.25 등록
Alphabet가MetaPlatforms와Meta의데이터센터에맞춤형AI칩을공급하는수십억달러규모의계약을논의중이라고TheInformation이월요일저녁보도했습니다.이는구글이AI인프라시장에서엔비디아의지배력에도전하는전략적변화를의미합니다.​제안된협약에따르면Meta는2027년부터자사시설에구글의텐서프로세싱유닛(TPU)을도입할예정이며,이르면내년부터구글클라우드에서TPU용량을임대받을계획입니다.이번거래는구글이기존에GoogleCloudPlatform을통한클라우드임대에만독점적으로TPU를제공해온오랜방침에서크게벗어난것이라할수있습니다이소식이발표된후,알파벳의주가는월요일장마감후시간외거래에서2.1%에서2.5%상승한반면,엔비디아의주가는1.8%하락했습니다.주가변동은알파벳이최근새롭게출시한Gemini3AI모델의긍정적인반응에힘입어정규장거래에서이미6%이상급등한직후에나타났습니다.​AI칩시장의전략적변화Google은Meta를비롯하여고빈도거래회사와주요금융기관등다양한잠재고객들에게TPU를적극적으로제안하고있으며,온프레미스배포가조직의엄격한보안및규정준수요구사항을충족하는데도움이될수있다고강조하고있습니다.Meta는현재자사애플리케이션전반에걸쳐매일30억명이상의사용자에게서비스를제공하는대규模AI인프라를구동하기위해주로NvidiaGPU에의존하고있습니다.​GoogleCloud경영진은TPU채택확대를통해Nvidia의연간매출의최대10%를확보할수있으며,이는수십억달러의잠재적이익을의미한다고믿고있습니다.이러한추진은AI컴퓨팅에대한글로벌수요가계속급증하고업계전반에걸쳐공급제약이지속되고있는상황에서이루어지고있습니다.​심화되는경쟁잠재적인Meta거래는맞춤형AI칩에대한Google의10년간의투자를입증할것입니다.Google은최근7세대TPU인Ironwood를출시했으며,이는이전세대보다4배의성능을제공하고2018년첫번째CloudTPU보다거의30배더에너지효율적이라고회사는주장합니다.​10월에Anthropic은수백억달러규모의거래에서Google의TPU최대100만개에액세스하기로약속했습니다.이AI스타트업은TPU의"가격대비성능및효율성"을결정의주요요인으로꼽았습니다.Google은TPU설계및제조를위해Broadcom과파트너십을맺고있으며,Broadcom의주가는월요일Google의AI모멘텀에대한긍정적인sentiment을반영하여10%급등했습니다.
675 조회
0 추천
2025.11.25 등록
Anthropic은월요일에ClaudeOpus4.5를출시하며,코딩,자율에이전트,사무생산성분야에서향상된기능을갖춘Claude4.5모델패밀리를완성했다.Amazon과Alphabet의지원을받는이AI스타트업은새로운플래그십모델을Google과OpenAI의최근출시제품에대한직접적인경쟁자로포지셔닝했다.​이모델은실제소프트웨어엔지니어링작업을위한벤치마크인SWE-benchVerified에서80.9%를달성하여,Google의Gemini3Pro(76.2%)와OpenAI의GPT-5.1CodexMax(77.9%)를능가했다.Anthropic의개발자관계책임자인AlexAlbert는BusinessInsider에이모델이"우리가정말로중요하게생각하는분야에서세계에서가장지능적인모델"을대표한다고말했다.​향상된직장역량ClaudeOpus4.5는확장된대화에서맥락을유지하는"무한채팅"과개발자가응답품질과토큰효율성의균형을맞출수있는새로운"노력매개변수"를포함하여기업사용자를대상으로하는여러기능을도입했습니다.Anthropic에따르면,중간노력수준에서이모델은ClaudeSonnet4.5의성능과일치하면서도출력토큰을76%적게사용합니다.​이번릴리스에는MicrosoftExcel및Chrome과의통합이포함되어있어AI가스프레드시트를분석하고브라우저기반작업을자동화할수있습니다.초기고객들은재무모델링에서20%의정확도향상과복잡한작업에서15%의효율성증가를보고했습니다.​시장경쟁이심화된다이번출시는지난주Google의Gemini3출시와이달초OpenAI의GPT-5.1데뷔에이어이루어졌습니다.MenloVentures의2025년중반보고서에따르면,Anthropic은기업AI시장의32%를점유하여OpenAI의25%점유율을추월했습니다.회사의시장점유율은2023년12%에서상승했으며,같은기간OpenAI는50%에서하락했습니다.​Amazon은Anthropic에80억달러를투자했으며,Google은20억달러를투입했습니다.두회사모두최근분기실적에서Anthropic지분으로인한수십억달러의미실현이익을보고했으며,Amazon은95억달러의세전이익을,Alphabet은이투자로인한지분증권에서107억달러의순이익을인식했습니다.​ClaudeOpus4.5는월$17부터시작하는Pro사용자,월$100의Max사용자,그리고Enterprise고객에게제공됩니다.이모델은GitHubCopilot과도통합되어있으며프로모션기간동안코딩에이전트의기본모델로제공될예정입니다.
664 조회
0 추천
2025.11.25 등록
OpenAI와전설적인디자이너조니아이브(JonyIve)는그들의비밀스러운AI하드웨어장치의작동가능한프로토타입이존재한다는사실을처음으로공개적으로확인했으며,새로운애플엔지니어링인재들의대거이탈이프로젝트개발일정을가속화시키고있다.2023년11월23일,EmersonCollective의DemoDay에서로렌파월잡스(LaurenePowellJobs)와의무대대화중,OpenAICEO샘알트먼(SamAltman)과아이브(Ive)는"우아하게단순하면서도약간장난기있는"이장치가2년이내에출시될수있다고밝혔다.이러한사실은OpenAI가불과지난한달동안40명이상의애플하드웨어엔지니어들을채용했다고블룸버그가보도한가운데나오게되었으며,이는최근실리콘밸리역사상가장공격적인인재영입사례중하나로평가되고있다.​"드디어첫프로토타입이나왔습니다,"라고인터뷰중알트먼은밝히며,디자인이"엄청나게멋지다"고극찬했다.아이브는이기기를덜위협적이고더직관적으로느껴지는기술을원하는사용자들에게매력적이라고설명하며,"거의생각할필요가없다"고말해,오늘날알림이넘치는스마트폰에서의도적으로벗어났음을시사했다.​인재유출이애플을좌절시키다이번대규모채용은OpenAI가지난해전애플임원에반스행키,탕탄,스콧캐넌과함께Ive가설립한AI하드웨어스타트업ioProducts를65억달러에인수한데에따른것입니다.이번거래는2025년7월에마무리됐으며약55명의엔지니어와디자이너가OpenAI로합류했습니다.Ive가이끄는디자인업체LoveFrom은독립성을유지하지만,회사전반에걸쳐"심층디자인및창의적책임"을맡게됩니다.​블룸버그의마크거먼에따르면,최근채용된40명은카메라엔지니어링,실리콘설계,기기테스트,제조,오디오,그리고VisionPro개발등애플의거의모든주요하드웨어부서를아우릅니다.이들이직자에는시니어디렉터와매니저도포함되어있으며,애플경영진은이번상황을중대한문제로인식하고있는것으로전해집니다.​이러한인재유출은애플이하드웨어수장존터너스(JohnTernus)의지휘아래스마트홈기기,로보틱스프로젝트,그리고잠재적으로카메라가탑재된에어팟등자사의AI기반하드웨어이니셔티브를추진하는도전적인시점에일어났습니다.또한애플은혁신된시리를2026년봄에출시하며이를구동할목적으로구글(알파벳)에게연간약10억달러를지불해제미니(Gemini)AI모델을라이선스하기로합의했으며,이모델은1.2조개의파라미터로구성되어애플이현재보유한1,500억파라미터모델을크게능가합니다.​AI하드웨어의새로운시대OpenAI와Ive의협업은인공지능이스마트폰과컴퓨터를넘어서완전히새로운물리적인터페이스를필요로한다는전략적선택을보여줍니다.기기의정확한형태는아직공개되지않았지만,이전보도에따르면화면이없고주머니에들어갈수있으며사용자의주변환경에맥락적으로반응한다는점이시사되고있습니다.알트만은사용자가기술과상호작용하고싶도록만드는것을목표라고밝혔으며,Ive는"마치한입베어물고싶을만큼매력적인"디자인테스트를적용했다고언급했습니다.​이파트너십은사용자가AI를경험하는데있어OpenAI가AI모델뿐만아니라하드웨어까지통제하겠다는의지를보여주는것으로,이는애플의수직통합이라는역사적전략을따르는셈입니다.Ive의팀이완전히합류했고애플출신인재가점점더늘어나면서,이프로젝트는원래의2026년목표에서더욱가속화되어2026년말이나2027년초에첫선을보일가능성이커지고있습니다.
711 조회
0 추천
2025.11.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입