AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 2026.01.04 14:32
483 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 98 페이지
(퍼플렉시티가정리한기사)미국은사우디아라비아의Humain에첨단인공지능칩의첫판매를승인할예정이며,이는도널드트럼프대통령이화요일백악관에서무함마드빈살만왕세자를접견하면서정책전환을의미합니다.워싱턴과리야드간의광범위한AI협정의일환으로예상되는이번승인은사우디아라비아가대규모데이터센터를구축하고글로벌AI허브로자리매김하는데필요한고성능반도체를수입할수있게합니다.​트럼프는왕세자와의회담을앞두고기자들에게사우디아라비아왕국에첨단미국AI칩판매를승인하기위해노력하고있다고말했습니다.이번승인은2023년부터워싱턴의허가가필요했던사우디아라비아로의협상된물량의AI칩수출을가능하게할것입니다.블룸버그는이번주안에협정이최종확정될수있다고보도했습니다.​사우디아라비아의AI야망사우디아라비아공공투자기금(PublicInvestmentFund)의지원을받는Humain은Amazon,AdvancedMicroDevices,xAI,그리고GlobalAI와협력하여수기가와트규모의데이터센터구축을발표할것으로예상됩니다.이사우디AI회사는트럼프의5월리야드방문당시Nvidia로부터18,000개의GB300GraceBlackwell칩을받기로하는파트너십을확보했으나,해당선적은미국정부의공식적인수출승인이필요했습니다.​무함마드빈살만왕세자는화요일회담에서사우디아라비아의미국내투자약속을6,000억달러에서약1조달러로늘렸으며,단기적으로500억달러를반도체분야에배정했습니다.Humain의CEO타렉아민(TareqAmin)은회사가첫데이터센터를개소하는2026년초까지미국산AI칩에접근할수있을것으로기대한다고밝혔습니다.사우디아라비아는2030년까지미국과중국에이어세계에서세번째로큰AI인프라제공국이되는것을목표로하고있습니다.​전략적의미칩승인은트럼프행정부가지난10월마이크로소프트를통해아랍에미리트에60,000개의고급Nvidia칩을공급하도록승인한데이어진것입니다.사우디관리들은지역AI경쟁에서UAE와의경쟁력을유지해야할필요성을강조해왔습니다.사우디왕국은풍부한토지와저렴한에너지를활용하여초대형기술기업들을유치하기위한저비용컴퓨팅허브로자리매김하고있습니다.​국가안보전문가들은이협정에고급칩이중국으로유입되는것을방지하기위한적절한안전장치가포함되어있는지면밀히검토할것입니다.UAE칩협정은사이버보안보호및칩이전제한을포함한"엄격한"보안조건을요구했습니다.​인권단체들은2018년언론인자말카슈끄지살해이후왕세자의첫미국방문기간동안리야드와의관계를심화시킨행정부를비판했습니다.카슈끄지살해에대한질문을받았을때,트럼프는왕세자를옹호하며"일은일어나는법"이며"그는그것에대해아무것도몰랐다"고말했습니다.
1128 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)LG생활건강은화요일자사의웨어러블뷰티기기인하이퍼리쥬버네이팅아이패치(HyperRejuvenatingEyePatch)가뷰티테크부문에서CES2026혁신상을수상했다고발표했으며,이는세계최대소비자가전전시회에서동사가받은첫번째수상이다.이번수상은뷰티브랜드들이인공지능과웨어러블기술을스킨케어솔루션에점점더통합하고있는가운데이루어졌다.​이기기는AI기반피부분석,생체모방패치기술,그리고제어된LED광치료를결합하여눈가의노화징후를타겟으로한다.60,000명의데이터베이스를활용하여AI기반진단프로그램을통해주름,색소침착및다크서클을분석한후,맞춤형화장품성분을추천하고문어흡반을모방한음압패치를통해전달한다.​문어에서영감을받은기술이기기의핵심은성균관대학교교수가설립한스타트업Mimetics와의파트너십을통해개발된음압패치입니다.Nature및ACSNano에게재된연구에따르면,문어빨판의원리를사용하여피부손상없이흡수를강화하는이패치기술은기존화장품보다5~6배높은흡수율을자랑합니다.이기술은4월LG생활건강의럭셔리브랜드TheHistoryofWhoo에서SkinActivatorPatch라는이름으로처음시장에출시되었습니다.​핸즈프리밴드형기기는또한1mm미만두께의유연한LED패치를통합하여더깊은피부층에최적화된광치료를제공합니다.공식CES설명에따르면,이시스템은눈주위영역을마이크로존으로세분화하고개인피부분석을기반으로정밀하게제어된광프로토콜을제공합니다.​광범위한뷰티테크추진이번수상은LG생활건강이스킨롱제버티(SkinLongevity)이니셔티브하에개인맞춤형뷰티기술에대한집중을확대하고있음을반영한다.강내규최고기술책임자(CTO)는회사가"미래뷰티기술연구를통해새로운고객경험을제공하기위해차세대웨어러블기기와개인맞춤형솔루션을지속적으로통합할것"이라고밝혔다.JournalofInvestigativeDermatology에발표된최근연구는연령과유전적소인모두를기반으로맞춤화를가능하게하는6가지주요노화지표와10가지유전바이오마커를확인했다.​LG생활건강은AI뷰티기술분야에서경쟁에직면해있다.아모레퍼시픽은MIT와함께개발한전자피부플랫폼으로노화원인을실시간으로분석하는스킨사이트(Skinsight)로올해7년연속CES혁신상을수상했다.​CES2026혁신상프로그램은36개부문에서3,600개이상의출품작을접수했으며,AI,디지털헬스,지속가능성부문이가장많은출품작을받았다.수상자들은1월6일부터9일까지라스베이거스에서열리는CES2026에서자사제품을선보일예정이다.
1124 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)구글이18일(현지시간)차세대인공지능(AI)모델'제미나이3'를공개하고핵심서비스인검색에출시당일부터즉시적용하는파격적인행보를보였다.이는구글이신규AI모델을검색엔진에첫날부터통합한첫사례로,AI경쟁에서공세적전략으로전환했음을시사한다.​순다르피차이구글최고경영자(CEO)는"제미나이3는전례없는수준의깊이와뉘앙스를이해할수있도록설계된최첨단추론능력을갖춘가장지능적인모델"이라고밝혔다.제미나이2.5출시이후약8개월만에등장한이번모델은주요AI성능지표에서오픈AI의GPT-5와앤스로픽의클로드를제치고1위를차지했다.​벤치마크성적으로경쟁사압도제미나이3프로는사용자직접평가방식인LM아레나리더보드에서1501점을기록해그록4.1(1484점)과클로드소넷4.5(1449점)를앞질렀다.박사급추론능력을측정하는'인류마지막시험'벤치마크에서는도구사용없이37.5%를달성해GPT-5프로의30.7%를크게상회했다.고난도수학문제로구성된매스아레나에이펙스에서는23.4%를기록하며GPT-5.1의1%를압도적으로넘어섰다.​코딩능력평가인웹데브아레나리더보드에서도제미나이3는1487점으로GPT-5(1473점)와클로드오퍼스4.1(1451점)을제쳤다.구글은더강화된추론모드인'제미나이3딥싱크'도공개했는데,이모델은인류마지막시험에서41%의정답률로역대최고기록을세웠다.​검색통합으로실용성강화구글은제미나이3프로를출시와동시에검색엔진의'AI모드',제미나이앱,AI스튜디오및버텍스AI등주요제품전반에즉시적용했다.구글의최고AI설계책임자인코라이카부크쿠오글루는"제미나이가모델출시속도뿐아니라사용자에게전달되는속도면에서도새로운기준을세웠다"고말했다.​미국내유료구독자는검색창에서'AI모드'탭을통해제미나이3의복잡한추론능력과새로운동적경험을즉시활용할수있다.구글은또한AI에이전트가소프트웨어작업을자율적으로계획하고실행할수있는개발플랫폼'안티그래비티'도함께공개했다.​구글이마이크로소프트의연례개발자회의'이그나이트2025'개최일에맞춰제미나이3출시를발표한것은경쟁기술기업견제목적이있는것으로풀이된다.인디펜던트분석기관아티피셜애널리시스는"제미나이3프로가현재시장을선도하고있으며GPT-5.1보다3점높은점수를기록했다"고평가했다.
1055 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)"에이전틱AI"라는용어는최근몇주동안기술분야를휩쓸었으며,기업들이자율적인인공지능시스템을중심으로자사제품을포지셔닝하기위해서두르면서업계컨퍼런스와마케팅자료를지배하고있다.그러나이용어의급속한확산은이것이진정한기술적변화를나타내는것인지,아니면단순히기존AI기능의리브랜딩에불과한것인지에대한논쟁을촉발시켰다.MIT슬론리뷰(MITSloanReview)에따르면,"합의된정의는없지만,에이전틱AI는일반적으로지속적인인간의감독없이결정을내리고,행동을취하며,역동적인환경에적응함으로써자율적으로목표를추구할수있는AI시스템을의미한다".AP통신은월요일에거대기술기업과스타트업들이자사제품설명에"에이전틱"을포함시키면서이표현이"마케팅과장과실제가능성의혼합"이되었다고보도했다.​산업모멘텀형성주요기술기업들이이번달업계행사에서주목할만한에이전트AI발표를진행했습니다.Microsoft는11월17일Ignite컨퍼런스에서Agent365를공개하며,이를플랫폼전반에걸쳐AI에이전트를관리하는"제어플레인"이라고설명했습니다.Google은11월에프로덕션급에이전트시스템의표준을확립하는54페이지분량의기술가이드라인을발표했으며,Amazon은11월16일자율에이전트를위한엔터프라이즈인프라를제공하는AmazonBedrockAgentCore를소개했습니다.​Salesforce는10월Dreamforce컨퍼런스에서AI제품을"Agentforce"로리브랜딩하며,"인간과AI에이전트를연결하도록설계된세계최초의플랫폼"을제공한다고자사를포지셔닝했습니다.IBM도WatsonxOrchestrate플랫폼에서에이전트기능을마찬가지로강조해왔습니다.​시장전망및채택산업분석가들은에이전트AI기술의상당한성장을전망하고있습니다.딜로이트는생성형AI를사용하는기업의25%가2025년에에이전트AI파일럿을시작할것이며,2027년에는도입률이50%로두배증가할것으로예측했습니다.가트너는2026년까지기업용애플리케이션의40%가작업별AI에이전트를통합할것으로예상하며,이는현재5%미만에서증가한수치입니다.​맥킨지연구에따르면에이전트AI는2030년까지연간4,500억달러에서6,500억달러의추가매출을창출할수있으며,구글클라우드는시장규모가2035-2040년까지1조달러에달할수있을것으로전망합니다.그러나가트너는10월에현재에이전트AI제품의공급이수요를크게초과하고있으며시장통합을예측한다고경고했습니다.​비평가들은기업들이진정한자율기능을제공하지않으면서기본적인AI워크플로우를에이전트로표시하는"에이전트워싱"에대한우려를제기했습니다.포브스는"에이전트워싱은기업들이현재의과대광고사이클을이용하는데도움이될수있지만비용이따른다"고지적하며,"사용자를혼란스럽게하고,고객을실망시키며,진정으로혁신적인도구를채택하는과정을방해한다"고경고했습니다.
1019 조회
0 추천
2025.11.19 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입