Loading...

AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 2026.01.04 14:32
519 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 108 페이지
(퍼플렉시티가정리한기사)일론머스크의출시한지한달된위키피디아대체서비스인그로키피디아(Grokipedia)가수천개의"의심스러운"그리고"문제가있는"출처를인용하고있어AI기반백과사전의신뢰성에대한심각한의구심을불러일으키고있다고코넬테크연구진이금요일발표한연구결과가밝혔다.​연구에따르면위키피디아에서복사되지않은그로키피디아문서는영어위키피디아커뮤니티에서"일반적으로신뢰할수없는"것으로간주되는출처를인용할가능성이3.2배더높고,위키피디아가완전히차단하는"블랙리스트"출처를포함할가능성이13배더높은것으로나타났다.인용중에는스톰프론트(Stormfront)와인포워즈(InfoWars)를포함한극우매체에대한수십건의참조가포함되어있다.​코넬테크연구진인해롤드트리드먼(HaroldTriedman)과알렉시오스만차를리스(AlexiosMantzarlis)는보고서에서"그로키피디아에서는출처관련안전장치가대부분제거된것이분명하다"고썼다."이로인해의심스러운출처가포함되고,잠재적으로문제가있는출처의전반적인비율이더높아지게된다."​논란속에출범한위키백과경쟁서비스머스크의회사xAI는10월27일80만개이상의AI생성기사를담은그로키피디아를출시하며,머스크가"위키피디아보다엄청난개선"이라고부른것으로포지셔닝했다.이억만장자는오랫동안위키피디아를좌파편향이라고비난해왔으며,이를"Wokepedia"라고부르고작년에2억명이상의X팔로워들에게비영리단체에기부를중단할것을촉구했다.​그러나이플랫폼은정확성문제로빠르게비판을받았다.PolitiFact는그로키피디아가존재하지않는출처를인용하거나참조된정보를포함하지않는출처를인용하는등허위인용을자주만들어낸다는것을발견했다.한사례에서,백과사전은파이스트의아버지가2021년에사망했다는Vice기사를인용했는데,실제기사는2017년것이었고사망에대한언급이없었으며당시그녀의아버지는여전히살아있었다.​위키피디아공동창립자지미웨일스는이프로젝트를일축하며CNBC에대규모언어모델이"대규모오류"를만들어낼것이라고말했다."저는그로키피디아를철저히검토할기회가없었고,흥미롭게생각하지만,일론머스크의탁월함에대한찬사로가득차있는것같습니다"라고웨일스는말했다.​투명성격차와이념적우려공개편집을허용하고변경사항과출처에대한상세한기록을유지하는위키백과와달리,그로키피디아는기사가AI로생성되었다는점을인정하는것외에는기사작성방법에대한어떠한통찰도제공하지않습니다.사용자는양식을통해피드백을제출할수는있지만항목을직접편집할수는없습니다.​이플랫폼은논란의여지가있는주제를다루는방식으로특히면밀한조사를받았습니다.한분석에따르면,그로키피디아의1월6일국회의사당공격에대한항목은사건자체보다언론보도에대한이의제기에더초점을맞추고있습니다.이백과사전에는또한InfoWars를인용하는"클린턴시체수"음모론을홍보하는기사도포함되어있습니다.​코넬공대연구결과에대한논평요청을받았을때,xAI는"레거시미디어는거짓말을한다(LegacyMediaLies)"라는자동응답을보냈습니다.목요일,머스크는그로키피디아가"충분히좋아지면(아직갈길이멀지만)""은하백과사전(EncyclopediaGalactica)"으로브랜드를변경할계획이라고발표했습니다.
1154 조회
0 추천
2025.11.18 등록
(퍼플렉시티가정리한기사)AI에이전트시스템의보안취약점을해결하는새로운스타트업이월요일1,100만달러의시드펀딩과이미계약을체결한8개의유니콘고객사를확보하며출범했습니다.세번째창업에나선앤드류버먼(AndrewBerman)이설립한Runlayer는AI에이전트가기업데이터및시스템과상호작용할수있도록하는새로운표준인모델컨텍스트프로토콜(ModelContextProtocol)에대한포괄적인보안을구축하기위해KhoslaVentures의키스라보이스(KeithRabois)와Felicis로부터투자를확보했습니다.​이회사는제품출시후불과4개월만에스텔스모드에서벗어났으며,이미Gusto,Rippling,dbtLabs,Instacart,Opendoor,Ramp를포함한수십개의고객사와계약을체결했습니다.Runlayer는또한Anthropic에서MCP의수석개발자인데이비드소리아파라(DavidSoriaParra)를엔젤투자자및고문으로영입했습니다.​보안침해가긴급한필요성을촉진하다2024년11월Anthropic이오픈소스로출시한ModelContextProtocol(MCP)은AI에이전트가인간의감독없이데이터에접근하고이동시키며변경할수있게해주는사실상의표준이되었습니다.OpenAI,Microsoft,AmazonWebServices,Google을비롯한주요모델제작사뿐만아니라수천개의기술기업들이이제이프로토콜을지원하고있습니다.​그러나MCP는본질적으로내장된보안기능이부족하여,실제배포된구현들에서여러취약점이발견되었습니다.2025년5월InvariantLabs의연구원들은MCP서버에서프롬프트인젝션취약점을발견했으며,이를통해무단으로비공개GitHub저장소에접근할수있었습니다.이듬달에는Asana가자사의MCP서버에서서로다른조직간의고객데이터가누출될수있는취약점을발견하고이를수정했습니다.​TechCrunch에따르면이러한보안문제들로인해Cloudflare,Docker,Wiz를비롯한여러회사들이다양한MCP보안제품을출시하게되었습니다.​올인원플랫폼접근방식Runlayer는단일솔루션이아닌종합적인보안을제공함으로써붐비는시장에서차별화를추구하고있습니다.이플랫폼은게이트웨이보안과모든MCP요청을분석하는위협탐지,허가된MCP서버전반의관찰성모니터링,맞춤형AI자동화를구축할수있는엔터프라이즈개발도구,그리고Okta와같은신원제공자와통합되는세분화된권한기능을결합합니다.​과거유아용모니터제조업체인Nanit와AI영상회의툴Vowel을설립했던버먼은2024년3월Vowel을매각한뒤Zapier의AI디렉터가되었습니다.그는Zapier에서최초의MCP서버중하나를구축하면서OpenAI및Anthropic과긴밀히협력했습니다.이후2025년8월,공동창업자인탈페레츠,비토르발로코와함께Zapier를떠나Runlayer를설립했습니다.
1220 조회
0 추천
2025.11.18 등록
(퍼플렉시티가정리한기사)Helldivers2개발사ArrowheadGameStudios의CEO는ArcRaiders에서AI생성음성을논란의여지가있게사용한것을옹호하며,게임업계가인공지능에대해극단적인입장을취하기보다는"중간지점"을찾아야한다고주장했습니다.ShamsJorjani의이러한발언은Eurogamer가ArcRaiders에별5개중2개만부여한후나왔으며,낮은점수는주로이추출슈터게임의AI텍스트음성변환기술구현때문이었습니다.이리뷰는게임이400만장이상판매되는상업적성공을거두었음에도불구하고게임의종합Metacritic점수를떨어뜨렸습니다.​"어쩌면,그럴수도있지않을까요,현실은그중간어딘가에있지않을까요?그럴수도있지않을까요?"Jorjani는TheGameBusinessShow와의인터뷰에서말했습니다."저는사람들이극단적인견해로뛰어든다는것을알게됩니다."​성우들이보수를받은후복제됨Nexon소유의ArcRaiders개발사EmbarkStudios는추가대사를생성하는AI모델학습에자신의목소리를사용하는데동의한성우들을고용했습니다.이시스템은아이템이름,위치,나침반방향에대한음성대사를생성하며,새로운콘텐츠가추가될때마다배우들이스튜디오에돌아올필요가없습니다.​Jorjani는이접근방식을칭찬하며,자신은개인적으로멀티플레이어게임에서음성채팅을피한다고언급했습니다."이것이더많은사람들이서로소통할수있게해주며,궁극적으로게임에좋은일이라고생각합니다"라고그는말했습니다."사람들이자신의작업에대해보상받을수있도록하기만하면됩니다.분명히중간지점이있을것입니다."​ArrowheadCEO는자신의스튜디오가게임자체에는AI를사용하지않지만,관리업무를위한효율성도구로는활용한다고명확히했습니다."우리는게임에AI를넣지않지만,영수증처리를더빨리할수있게해준다면,그것은모두를위한더많은Helldivers를의미합니다"라고그는말했습니다.​업계전반의긴장이논쟁은주요퍼블리셔들이AI사용을확대함에따라더광범위한긴장을반영합니다.SquareEnix는최근2027년말까지품질보증및디버깅작업의70%를자동화하겠다는계획을발표했습니다.Krafton은10월에직원들을위한자발적사직프로그램을포함하는"AI우선"방침을시작했습니다.Microsoft소유의Activision은CallofDuty:BlackOps7에서AI로생성된콜링카드아트워크로인해반발에직면했습니다.​한편,PUBG크리에이터BrendanGreene은Eurogamer에"커뮤니티가AI관련사안에반발하는것을보고정말힘을얻었다"고말했으며,이는스튜디오들이효율성향상과창의적무결성및인력문제사이에서균형을맞추려는가운데업계의이념적분열을강조합니다.​
1131 조회
0 추천
2025.11.18 등록
(퍼플렉시티가정리한기사)Xbox소유스튜디오인ObsidianEntertainment는게임개발에생성형AI를사용하지않았다고확인하며,게임업계전반에걸쳐증가하는이기술의채택에대해확고한반대입장을취했습니다.이러한선언은여러주목받는게임들이AI생성콘텐츠로인해반발에직면하고있는시점에나왔습니다.GameFile과의인터뷰에서Obsidian개발자인JoshSawyer,KateDollarhyde,LeonardBoyarsky는스튜디오가이기술을전혀사용하지않는다고명확히밝혔습니다.Obsidian이글쓰기에생성형AI를사용하는지묻는질문에Sawyer는"우리가사용한것이아니다"라고답했으며,Boyarsky는"우리는전혀사용하지않았다"고덧붙였습니다.​이러한입장은2025년Obsidian의놀라운성과를고려할때특히주목할만합니다.약285명의직원을고용하고있는이스튜디오는올해판타지RPGAvowed,서바이벌게임Grounded2,그리고SF후속작TheOuterWorlds2라는세개의주요타이틀을출시했습니다.크리에이티브디렉터를맡고있는Boyarsky는AI기반글쓰기에대해추측했던자신의2019년발언을회고하며,이제는과거의자신을"머리를한대때리고싶다"고말했고,그러한개념은빠르게"매우다루기어려워질것"이라고덧붙였습니다.​논란이주요출시작들을휩쓸다Obsidian의입장은최근업계논란과뚜렷한대조를이룬다.CallofDuty:BlackOps7은호출카드와게임내자산에AI생성아트를사용한것에대해강한비판을받았으며,플레이어들은지브리스타일아트워크에서손가락이6개인캐릭터와같은명백한오류를발견했다.이러한반발로인해미국하원의원RoKhanna는11월14일"기업이더큰이익을얻기위해일자리를없애는데AI를사용하는것을방지하는"규제를요구했다.​ArcRaiders는Eurogamer의리뷰가AI생성음성사용을비판하며게임에2/5점을부여한후유사한논쟁을불러일으켰다.EpicGamesCEOTimSweeney는소셜미디어에서이기술을옹호하며리뷰를"정치적"이라고부르고AI가성우들에게기회를창출할것이라고주장했다.NexonCEOJunghunLee는플레이어들이"이제모든게임회사가AI를사용하고있다고가정해야한다"고제안했으나,StrangeScaffold의XalavierNelsonJr.를포함한여러인디개발자들이이주장에즉각반박했으며,그는자신의스튜디오가"그런것은전혀건드리지않고연간대략3개의게임을출시한다"고언급했다.​출판사들,AI통합에박차를가하다플레이어들의저항에도불구하고,여러주요퍼블리셔들이AI도입을가속화하고있습니다.SquareEnix는2027년까지품질보증업무의70%를자동화할계획을발표했으며,ElectronicArts는직원들의AI도구사용을의무화했습니다.Ubisoft는Anno117:PaxRomana에서AI생성아트가검토과정을"통과했다"고인정하며,다가오는패치에서이를교체하겠다고약속했습니다.​Xbox책임자PhilSpencer는10월에Microsoft가자사스튜디오에AI사용을강제하지않으며,각팀이자체적으로결정을내릴수있도록허용한다고밝혔습니다.
1128 조회
0 추천
2025.11.18 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입