AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 2026.01.04 14:32
464 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 91 페이지
(퍼플렉시티가정리한기사)Google은이번주자율에이전트를통해소프트웨어개발을혁신하겠다는야심찬AI기반개발플랫폼Antigravity를공개했지만,초기사용자들은무료프리뷰를둘러싼초기흥분을가라앉힌상당한기술적장애물에직면하고있습니다.기술적문제가출시를방해하다11월17일Gemini3AI모델과함께발표된이플랫폼은빠른크레딧소진과신뢰성문제로비판을받고있습니다.HackerNews의사용자들은집중적으로사용한지약20분만에크레딧이소진되었으며,추가할당량을구매할수있는방법이없다고보고했습니다.한개발자는"내프로젝트에사용하기시작했는데약20분후에—오,안돼.크레딧이다떨어졌어요"라고쓰면서,경쟁플랫폼인Cursor로다시전환했다고덧붙였습니다.​기술저널리스트SimonWillison은테스트중에"모델공급자과부하로인해에이전트실행이종료되었습니다.나중에다시시도해주세요"라는오류메시지를받았다고기록했습니다.DevClass출판물도유사한문제를겪었으며,에이전트매니저가무한정사용중표시를나타내다가과부하메시지와함께종료되었습니다.​VisualStudioCode의포크로구축된Antigravity는AI에이전트가코드편집기,터미널및Chrome브라우저전반에걸쳐자율적으로작동하는"에이전트우선"개발패러다임을도입합니다.이플랫폼은Gemini3Pro,Anthropic의ClaudeSonnet4.5,OpenAIGPT-OSS를포함한여러AI모델을지원합니다.Google엔지니어KevinHou는이시스템이작업을위한세가지주요인터페이스를제공한다고설명했습니다:에이전트매니저창,코드편집기,자동화된브라우저.​보안우려사항및설계선택플랫폼의이용약관은"Antigravity는특정보안제한사항이있는것으로알려져있다"고명시적으로경고하며,데이터유출과코드실행을구체적인위험으로식별하고있습니다.이러한경고에도불구하고,기본구성은"에이전트지원개발"모드로작동하며,여기서AI는어떤작업이사람의승인을필요로하는지자율적으로결정합니다.​"이용약관은민감한데이터처리를피하고에이전트가수행하는모든작업을검증할것을권고합니다.하지만Google이이를진지하게받아들였다면에이전트에게상당한자율성을부여하는제품기본값을설정하지않았을것이라고생각할수있습니다"라고DevClass는언급했습니다.​추가적인문제점으로는GoogleWorkspace계정과의호환성문제가있으며,플랫폼의FAQ는사용자가개인Gmail주소로전환할것을권장합니다.또한플랫폼은더포괄적인VisualStudioCode마켓플레이스가아닌OpenVSX확장레지스트리에의존합니다.​어려운출시에도불구하고,Google은Antigravity를개발자가코드를직접작성하기보다AI에이전트를조율하는설계자로서작동하는"에이전트우선소프트웨어개발"의미래상으로포지셔닝하고있습니다.회사는Team및Enterprise가격책정등급이곧출시될것이라고밝혔지만,에이전트워크플로우의컴퓨팅집약적특성을고려할때현재무료등급의지속가능성은여전히불확실합니다.
945 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)YannLeCun은수요일에12년이상근무한를연말에떠나자신의인공지능스타트업을설립할것이라고발표했으며,이는소셜미디어거대기업의AI운영내지속적인격변속에서이분야의가장영향력있는선구자중한명의퇴사를의미한다.​65세의LeCun은LinkedIn게시물에서자신의새로운회사가AdvancedMachineIntelligence연구에집중할것이며,"물리적세계를이해하고,지속적인기억을가지며,추론할수있고,복잡한행동순서를계획할수있는"AI시스템을개발할것이라고밝혔다.Meta는이새로운벤처와파트너십을맺을예정이지만,협력의세부사항은아직불분명하다.​메타AI의불안정성시대이번퇴사는메타의AI부문이격동의시기를겪고있는가운데발생했습니다.10월에회사는슈퍼인텔리전스랩스에서약600개의직책을삭감했으며,이는LeCun이설립을도운기초AI연구부서에영향을미쳤습니다.이번주초,널리채택된PyTorch프레임워크의창시자인SoumithChintala가MiraMurati의스타트업에합류하기위해떠났습니다.​메타는올해ScaleAI의전CEO였던28세의AlexandrWang하에AI운영을극적으로재편했으며,그는메타가그의회사에143억달러를투자한후합류했습니다.재편성은훈련,연구,제품및인프라에집중하는네개의별개팀을만들었으며,회사의Llama4모델출시는내부적으로나외부적으로미온적인반응을얻었습니다.​갈라지는비전LeCun의Meta방향성과의철학적분열은최근몇달동안깊어졌습니다.Meta가OpenAI와Google과경쟁하기위해대규모언어모델에막대한투자를한반면,LeCun은그러한접근방식을"막다른길"이라고공개적으로비판하며,텍스트만으로훈련된AI는인간수준의지능을달성할수없다고주장했습니다.그의새로운스타트업은세계모델—물리적현실을이해하기위해비디오와공간데이터로부터학습하는AI시스템—을추구할것입니다.​LeCun은2013년Facebook에FAIR의창립이사로합류했으며,2018년이사직에서물러났지만수석AI과학자로는남아있습니다.그는딥러닝분야의혁신적업적으로GeoffreyHinton및YoshuaBengio와함께2019년튜링상을수상했습니다.그는뉴욕대학교에서시간제로계속강의할예정입니다.
942 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)Mastercard는2025년11월19일두바이에서AgentPay를선보였으며,이는미국외지역에서AI기반결제시스템을첫번째로도입한것입니다.두바이미래포럼에서대형유통업체MajidAlFuttaim및핀테크기업Dataiera와의파트너십을통해진행된이번출시는소비자가AI에이전트를사용하여음성명령만으로VOXCinemas영화티켓을포함한제품을검색,선택및구매할수있는방법을보여줍니다.​UAE인공지능부장관OmarSultanAlOlama와MastercardCEOMichaelMiebach는AI에이전트가사용자가웹사이트를탐색하거나결제정보를수동으로입력할필요없이공포영화티켓두장을구매하는플랫폼의첫실시간거래를목격했습니다.AlOlama는"UAE는일상생활을단순화하기위해인공지능을수용하고배포하는데있어새로운글로벌기준을설정했습니다"라고말했습니다.​혁신과보안의균형이번확장은Mastercard가U.S.Bank및Citibank와의초기출시에이어연말까지모든미국카드발급사에AgentPay를활성화할준비를하면서이루어졌습니다.이러한움직임은2025년10월에출시된Visa의TrustedAgentProtocol및Google의AgentPaymentsProtocol과함께점점더경쟁이치열해지는환경에서결제네트워크의입지를강화합니다.​그러나보안문제가이기술의급속한배포에그림자를드리우고있습니다.11월초Money20/20컨퍼런스의결제임원들은에이전트AI가사기위험을증폭시킬수있으며,FraudGPT와같은악성프로그램이연간1,400달러의낮은구독료로이용가능하다고경고했습니다.Experian의운영전략책임자인NashAli는"우리는지금에이전트AI가다가오면서사기의또다른폭발직전에서있습니다"라고말했습니다.​Miebach는이러한과제를인정하며"안전,보안및신뢰의문제가매우중요하다"고말하고강력한안전장치의필요성을강조했습니다.Visa의프로토콜은암호화서명을사용하여합법적인AI에이전트와악성봇을구별하며,업계관찰자들은구매결정에서AI자율성에대한고객의편안함에대한질문이지속되고있다고지적합니다.​UAE의전략적기반두바이출시는UAE인공지능청과의협력으로구축된마스터카드의2023년에미리트내첨단AI및사이버기술센터설립을기반으로합니다.마스터카드의동유럽,중동및아프리카지역사장인디미트리오스도시스는AgentPay가"에이전틱커머스가투명성,동의및보안을기반으로구축되도록보장한다"고말했습니다.​2025년시장보고서에따르면에이전틱커머스시장은2033년까지51억9천만달러에달할것으로예상됩니다.배포가가속화됨에따라업계는AI기반쇼핑이주류가되기전에책임프레임워크,사기예방및소비자신뢰문제를해결해야한다는압박에직면해있습니다.
952 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)식이지침에대한인공지능의존도가높아지면서영양전문가들뿐만아니라챗봇들자체에서도경고가나오고있습니다.새로운연구는만성건강상태를관리하는사람들을위해AI가생성한식단계획의한계를드러냅니다.소비자권익단체인위치(Which?)는11월18일,ChatGPT와GoogleGemini를포함한인기AI도구들이일반적인소비자질문에대해부정확하고잠재적으로위험한건강조언을제공했다는연구결과를발표했습니다.여섯개의AI플랫폼을평가한이번연구에서전문가들은응답의정확성과윤리적책임성을기준으로ChatGPT가전체적으로64%의점수를받았다고밝혔습니다.특히우려되는점은,조사대상자중5명중1명이의료조언을받을때항상또는자주AI에의존한다고답했다는점입니다.​AI가부족할때영양전문가들은AI기반앱이일반적인식단계획및추적을간소화할수있지만,개인맞춤형식이요법관리를위해필요한중요한역량이부족하다고강조합니다.영양컨설턴트루팔리두타는특히건강문제를가진사람들의경우,AI가임상적판단을대체할수없다고말합니다.두타는“AI가정보를단순화하게하고,영양사가그정보를개인에게맞추도록해야한다”라며진정한식이관리에는기술과임상전문성모두가필요하다고설명합니다.​영양학박사니체타바티아는더욱근본적인문제를지적합니다.AI가내놓는조언은대부분일반적이며,개개인의생물학적특성과행동을반영하지못한다는것입니다.당뇨병,심장질환,PCOD,갑상선기능저하증,암등과같은질환을가진사람들은스트레스수치와감정적요인까지고려하는맞춤형평가가필요한데,이는AI가해결할수없는부분입니다.​2023년학술지「Nutrition」에게재된연구에서는ChatGPT가실험된56건중4건에서견과류가들어가지않은식단에아몬드우유를포함시켜,견과류알레르기가있는사람들에게잠재적으로위험한오류를범했습니다.또다른연구에서는올해ChatGPT가활동적인사람에게실질적으로약1,950칼로리가필요한데도하루1,200칼로리만제공하는식단을제안하며,단백질·식이섬유·채소가불충분하다는점이밝혀졌습니다.​잠재적인건강위험전문가의지도없이일반적인AI식단제안을따르는것은근육약화,칼슘결핍,산성화,편두통,피로,수면장애,과민성대장증상을유발할수있다고Bhatia박사는말한다.최근의체계적문헌고찰에따르면AI생성식이중재가일부맥락에서가능성을보이지만,영양학적정확성,일관성및안전성에대한우려는여전히남아있다.​ChatGPT조차도자신의한계를인정한다.영양조언제공에대해직접질문했을때,챗봇은건강상태진단,섭식장애해결,안전한보충제조언제공,그리고음식의문화적·정서적측면이해에있어부족함을인정한다."저는여러분이탐색하도록돕고,정보를제공하며,건강에해로운것이있을때경고해야합니다"라고ChatGPT는말하며,"최종선택은항상여러분으로부터나와야합니다"라고덧붙인다.​등록영양사인StaciGulbin은AI를시작점으로만사용할것을권장하며,만성질환,섭식장애이력,또는복잡한영양문제를가진개인은인간전문가의도움이필요하다고강조한다.
955 조회
0 추천
2025.11.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입