Loading...

AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 2026.01.04 14:32
487 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 99 페이지
(퍼플렉시티가정리한기사)Microsoft는화요일샌프란시스코에서열린Ignite2025컨퍼런스에서Agent365를공개하며,조직이운영전반에걸쳐확산되는AI에이전트를추적,보호및관리할수있도록설계된중앙집중식플랫폼을선보였습니다.​이플랫폼은리서치기업IDC에따르면2028년까지전세계적으로배포되는AI에이전트수가13억개로급증하면서중요한과제가될것으로애널리스트들이예측하는문제를해결합니다.Agent365는IT관리자에게Microsoft의도구로구축되었든타사플랫폼으로구축되었든관계없이조직내에서작동하는모든AI에이전트를모니터링할수있는통합대시보드를제공합니다.​"Agent365는에이전트를위한제어플레인으로,사람을관리하기위해신뢰하는인프라를에이전트로확장합니다"라고Microsoft의AIatWork최고마케팅책임자인JaredSpataro가블로그게시물에작성했습니다.​에이전트인력관리이플랫폼은다섯가지핵심기능을포함합니다:모든에이전트를추적하는레지스트리,MicrosoftEntra를통한고유에이전트ID로접근제어,에이전트와데이터간의연결을보여주는시각화대시보드,Microsoft365앱과의상호운용성,그리고MicrosoftDefender와Purview를통한보안보호.​"신규직원이나계약직근로자에게신원을제공하는것과같은방식으로,에이전트에게도신원과접근제어를제공하게될것입니다"라고Microsoft상업사업부의CEO인JudsonAlthoff가CNBC에말했습니다.​Agent365는Microsoft의CopilotStudio와Foundry로구축된에이전트뿐만아니라Adobe,ServiceNow,Workday와같은파트너및Genspark과같은신흥스타트업의에이전트도지원합니다.전MicrosoftBing팀멤버인EricJing이설립한이스타트업은2025년4월SuperAgent플랫폼출시후5개월만에연간반복수익5천만달러를달성했습니다.​기업도입시작세계최대회계법인중하나인EY는이미AI에이전트의내부카탈로그를구축했지만,현재는더나은감독을얻기위해Agent365를구현하고있다고회사의전무이사인MarkLuquire가밝혔다.​Agent365는Microsoft365Copilot라이선스를보유한고객에게AI혁신에대한조기액세스를제공하는Microsoft의Frontier프로그램을통해이용할수있다.이플랫폼은IT팀이새로운에이전트를승인하고,사용량을모니터링하며,보안위협을식별하고,조직정책을준수하지않는에이전트를비활성화할수있도록한다.​Microsoft의비즈니스앱및에이전트부문사장인CharlesLamanna는이플랫폼이"조직이에이전트를구축하고,보안을유지하며,확장하는방식에있어새로운장을여는것"이라고말했다.
1013 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)오늘발표된새로운연구에따르면,금융리더5명중4명이상이인공지능이사기및금융범죄에악용될것을우려하고있으며,이는AI가금융운영에깊숙이통합되면서기술의악용가능성에대한불안감이증가하고있음을보여줍니다.500명의금융전문가와C-레벨의사결정권자를대상으로한설문조사를기반으로한Billtrust의연구는특히정교한사기기법이확산되면서82%가AI의악용가능성에대해우려하고있다는것을발견했습니다.응답자의거의절반인45%가AI로생성된피싱이메일을접했다고보고했으며,29%는알려진연락처를사칭하는데사용된AI음성복제를목격했습니다.​Billtrust의AI및분석부문수석부사장인AhsanShah는"금융리더들이AI를수용하고있지만,책임있는구현을요구하고있습니다"라고말했습니다."우리의연구는AI에대한신뢰가투명성,인간의감독,그리고윤리적제약에달려있음을보여줍니다.이것들은선택적기능이아닙니다.이것들은기초적인요구사항입니다."​증가하는위협환경이러한조사결과는금융부문에영향을미치는보다광범위한추세를강조합니다.공인사기조사관협회(AssociationofCertifiedFraudExaminers)와SAS가이번주발표한별도의설문조사에따르면,사기방지전문가의77%가지난24개월동안딥페이크소셜엔지니어링의가속화를보고했으며,83%는추가증가를예상하고있습니다.현재피싱이메일의82%이상이어떤형태로든AI생성콘텐츠를사용하고있으며,이를통해사기범들은설득력있는사기를최대40%더빠르게만들수있습니다.​"TrustinAI:WhatFinanceLeadersNeedtoEmbraceArtificialIntelligence"라는제목의Billtrust보고서는음성복제,딥페이크화상통화,설득력있게브랜드화된가짜청구서를포함한AI기반사기의정교함이증가하고있음을강조합니다.그러나투명성격차는여전히존재합니다:76%가지불전에사기성청구서를적발할수있다고믿고있음에도불구하고,조직의27%는의심스러운활동을추적하지않거나그수치를확실히알지못합니다.​책임있는배포추진우려에도불구하고,재무리더들은AI도입을추진하고있습니다.연구에따르면83%가향후2년내에AI기반솔루션을구현할계획입니다.이는금융서비스에서광범위한AI통합을보여주는더넓은산업트렌드와일치하며,현재90%의금융기관이사기탐지에AI를사용하고있습니다.​보고서는책임감있는AI배포를위한프레임워크를강조하는데,여기에는감독을위한인간개입루프(human-in-the-loop)아키텍처,AI출력의투명성및설명가능성,지속적인거버넌스및성과검토,그리고조직의가치와일치하는안전하고윤리적인배포가포함됩니다.Shah에따르면,재무팀은"가시성이나통제를희생하지않으면서확장가능한시스템"이필요하며,인간의전문성을대체하기보다는보강하는AI를구축해야합니다.
1016 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)스웨덴AI코딩스타트업Lovable은연간반복수익2억달러를달성했으며60억달러를초과하는기업가치평가로새로운자금조달을준비하고있다고발표했습니다.하지만새로운보안연구는플랫폼에서생성된코드의안전성에대한우려를제기하고있습니다.​스톡홀름에본사를둔이회사는불과1년전에출시되었으며,7월에18억달러의기업가치평가로2억달러를확보한지5개월도채되지않아새로운자금조달에근접해있습니다.급속한성장에도불구하고Lovable은아직수익을내지못하고있으며,이는AI코딩시장에서속도와지속가능성사이의긴장을강조하고있습니다.​플랫폼전반에걸쳐보안결함감지Lovable의발표시점은11월12일OXSecurity가발표한보고서와일치하는데,이보고서에서는해당플랫폼이경쟁사인Base44및Bolt와함께사용자가명시적으로보안애플리케이션을요청하더라도취약한코드를생성한다는사실을발견했습니다.​OXSecurity의테스트결과,세가지AI앱빌더모두저장형크로스사이트스크립팅(XSS)취약점이있는웹애플리케이션을생성하여공격자가악성코드를주입하고,세션을탈취하며,데이터를훔칠수있는것으로밝혀졌습니다.보고서는Lovable의내장보안스캔이취약점을66%의경우에만탐지한반면,Bolt의스캔은문제를전혀식별하지못했다고비판했습니다.​"일관성없는탐지는탐지가없는것보다더나쁩니다.신뢰할수없는보호를제공하면서잘못된확신을만들어내기때문입니다"라고OXSecurity연구원들은밝혔습니다.​Lovable은이러한발견을일축하며,문제가플랫폼수준이아닌애플리케이션별문제라고언급했습니다."검토결과,귀하가설명하는동작의결과로인한중대한보안영향은없는것으로보입니다"라고회사는응답했습니다.​우려에도불구하고시장모멘텀보안우려에도불구하고"바이브코딩"분야에대한투자자들의열의는수그러들지않았습니다.NvidiaCEO젠슨황은최근CNBC에서Lovable을칭찬하며,엔터프라이즈AI분야에서가장빠르게성장하는기업중하나라고말했고,Nvidia엔지니어들이이제AI코더를사용하고있다고언급했습니다.​Lovable의성장세는폭발적이어서,7월230만명에서11월까지800만명의사용자를확보했습니다.이회사는매일플랫폼에서10만개의새로운제품이만들어지고있다고보고했습니다.​경쟁사들도상당한투자를유치했습니다.Base44는6월에Wix에8천만달러에인수되었고,Bolt는1월에7억달러가치평가로1억550만달러를조달했습니다.
1010 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)기업회계자동화에초점을맞춘창업1년차인공지능스타트업Maxima가시드및시리즈A펀딩을합쳐4,100만달러를조달했다고캘리포니아주샌마테이오에본사를둔이회사가화요일발표했다.이번라운드는RedpointVentures와KleinerPerkins가주도했으며,AudaciousVentures와전NFL선수JoeMontana가참여하여회사가치를1억4,300만달러로평가받았다.​이번펀딩은AI기반기업용소프트웨어,특히백오피스운영을대상으로하는도구에대한투자자들의급증하는관심을반영한다.AI스타트업에대한벤처캐피탈투자는2025년전세계적으로1,927억달러라는기록적인수준에도달할것으로예상되며,이는전세계모든벤처펀딩의절반이상을차지한다.기업회계자동화시장은2025년124억4천만달러에서2033년까지284억3천만달러로성장할것으로예상된다.​기존공급업체에대한도전Maxima의플랫폼은조정,분개입력,재무마감워크플로우와같은노동집약적인회계업무를자동화하는것을목표로하며,SAP및BlackLine과같은기존업체들과경쟁하고있습니다.이회사는자사의AI에이전트가회계팀이검토할재무보고서를준비할수있으며,정확성을유지하면서마감주기를최대80%까지단축할수있다고주장합니다.​EY,Citigroup,Barclays,Rubrik에서재무업무를담당했던CEOYogiGoel은Reuters와의인터뷰에서"그들은인간이업무를수행하고감사자가와서업무를확인할수있도록업무를기록한다는핵심가정을가지고있었습니다"라고말했습니다."우리는에이전트가업무를수행하고인간이이를검토한다는관점에서완전히처음부터새로시작하고있습니다."​이번발표는올해초MIT연구에서AI파일럿프로젝트의95%가초기테스트를넘어서지못한다는결과가나온후기업환경에서AI신뢰성에대한우려가지속되는가운데나왔습니다.그러나Goel은회사가"고객을위해수백만건의거래를처리했으며단한건의오류도발생하지않았다"고밝혔습니다.​초기견인력Maxima의고객으로는핀테크기업SpotOn,HR소프트웨어스타트업Rippling,그리고ScaleAI가있으며,ScaleAI의회계책임자JoshuaWaldron은로이터에이플랫폼이변동분석과같은작업에소요되는시간을며칠에서몇시간으로단축했다고말했습니다.2024년8월Goel과전Twitter엔지니어AkshayaSrivatsa,그리고전Netflix엔지니어JackLiao가공동창립한이회사는신규자본을활용하여31명의팀을확장하고제품개발을가속화할계획입니다.​이번투자라운드에는전BlackLine임원인AndresBotero와EricBorrmann,그리고Rubrik과Vanta의CFO들도참여했습니다.10월에Maxima는RedpointVentures의첫번째AI64목록에선정되어기업용AI애플리케이션을형성하는가장유망한비상장기업으로인정받았습니다.
1009 조회
0 추천
2025.11.19 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입