Loading...

AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 2026.01.04 14:32
759 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 135 페이지
(퍼플렉시티가정리한기사)AI보안회사Mindgard가11월12일공개한보고서에따르면,OpenAI의Sora2비디오생성모델의취약점으로인해공격자가오디오전사를통해숨겨진시스템프롬프트를추출할수있다고합니다.이번발견은텍스트,이미지,비디오,오디오간의변환이정보유출을위한예상치못한경로를만드는멀티모달AI시스템의새로운보안과제를강조합니다.​오디오전사가보안장치를우회합니다AaronPortnoy가이끄는Mindgard연구원들은11월3일Sora2를대상으로실험을시작했으며,15초길이의짧은클립으로음성을생성하는것이모델의기초명령어를복구하는가장충실도높은방법임을발견했습니다.전통적인시각적방법은이미지와비디오프레임에렌더링된텍스트가시퀀스전반에걸쳐빠르게왜곡되어글자가읽을수없는근사치로변형되면서실패했습니다.QR코드와같은인코딩된형식역시똑같이신뢰할수없는것으로판명되었으며,Mindgard의보고서에따르면"시각적으로는그럴듯하지만디코딩가능한횡설수설"을생성했습니다.​획기적인발견은연구원들이Sora2에게시스템프롬프트의일부를말하도록요청했을때이루어졌으며,시간제한내에더많은내용을담기위해종종가속화된속도로진행되었습니다.이러한오디오클립을전사하고조각들을이어붙임으로써,그들은메타데이터를먼저생성하고,명시적으로요청되지않는한저작권이있는캐릭터를피하며,성적으로암시적인콘텐츠를금지하는등의규칙을드러내는거의완전한시스템프롬프트를재구성했습니다.​AI보안에대한광범위한영향OpenAI는11월4일다중모달시스템전반의프롬프트추출위험에대한일반적인인식을언급하며이취약점을인정했다.Sora2의시스템프롬프트자체에는매우민감한데이터가포함되어있지않지만,보안연구원들은시스템프롬프트가행동가드레일로기능하며구성비밀로취급되어야한다고강조한다.Mindgard는보고서에서"시스템프롬프트는모델안전경계를정의하며,유출될경우후속공격을가능하게할수있다"고밝혔다.​이취약점은다중모달모델의고유한약점을악용하는데,변환과정에서의미적표류가누적된다.AI시스템이여러데이터유형을처리함에따라시스템지침을보호하는것이점점더어려워지고있다.Mindgard는개발자들이시스템프롬프트를독점정보로취급하고,오디오및비디오출력에서유출을테스트하며,생성물에길이제한을구현할것을권장한다.​이번공개는9월말에출시된Sora2에대한광범위한조사가이루어지는가운데나왔다.PublicCitizen은11월11일딥페이크와유해콘텐츠에대한우려를이유로OpenAI에이도구를임시철회할것을촉구했다.OpenAI는Sora2에여러안전계층이포함되어있다고주장해왔지만,비평가들은그효과에의문을제기하고있다.
1519 조회
0 추천
2025.11.14 등록
(퍼플렉시티기정리한기사)부산대학교와서울대학교의연구진들이올해저명한통계학저널에발표한연구결과에따르면,데이터왜곡에대항하여인공지능및의료영상시스템을강화할수있는새로운통계적방법을개발했습니다.휴버평균(Hubermean)이라고불리는이방법은현대데이터과학의지속적인과제를다룹니다:평평한표면이아닌곡면기하학적공간에존재하는정보를분석하는것입니다.3차원의료스캔부터로봇방향데이터에이르기까지,오늘날의복잡한데이터대부분은수학자들이리만다양체라고부르는공간에존재하며,여기서전통적인통계도구들은노이즈나이상치에직면했을때종종실패합니다.​정확한분석을위한장벽허물기부산대학교통계학과이종민교수는서울대학교정성규교수와함께2025년8월25일JournaloftheRoyalStatisticalSociety:SeriesB에연구를발표했다.​연구발표에따르면이교수는"우리연구는리만다양체에서고전적인프레셰평균의강건한일반화를소개한다"며"이는이상치에대한더큰안정성을제공하고기하학적데이터에대한통계분석의신뢰성을향상시킨다"고말했다.​Huber평균은데이터구조에자동으로적응하여,일반적인관측값에대해서는최소제곱손실을사용하고큰편차에대해서는절대편차손실을사용한다.이러한균형을통해0.5의붕괴점을달성할수있으며,이는데이터의절반이이상치이거나극단값이더라도추정량이신뢰할수있음을의미한다.​산업전반의응용분야이방법의잠재적응용분야는과학및공학분야전반에걸쳐확장됩니다.의료영상분야에서Huber평균은뇌나장기형상데이터의평균화를개선하여더정확한진단으로이어질수있습니다.로봇공학분야에서는시스템이소음이많거나예측불가능한환경에서도움직임및방향데이터를더잘해석하는데도움이될수있습니다.AI및머신러닝분야에서는기하학적데이터를다루는모델을더견고하게만들수있습니다.​이교수는"강건하고기하학적으로인식하는데이터분석의기반을제공함으로써,이연구는신뢰할수있는차세대AI,정밀의료,그리고실제세계와상호작용하는지능형기술을조용히뒷받침할수있을것"이라고덧붙였습니다.​이연구는추정량의존재성,유일성,수렴성,불편성에대한이론적보장과함께실제로빠르게수렴하는새로운계산알고리즘을제공합니다.
1706 조회
0 추천
2025.11.14 등록
(퍼플렉시티가정리한기사)장수산업은"에이전틱AI(AgenticAI)"—지속적인학습과자율적의사결정이가능한적응형인공지능시스템—가개념에서임상적용으로이동하면서새로운장을맞이하고있습니다.11월11일발표된바에따르면,전문가들은이러한자가개선시스템을개인의생물학적데이터와생활습관데이터를지속적으로분석하는지능형건강동반자로묘사하며,이는단순히정적보고서를생성하는기존AI모델과는차별화된다고설명합니다.​TechIPM의수석컨설턴트인AlexLee는기존AI가일회성예측을생성하는계산기처럼작동하는반면,에이전틱AI는혈액검사결과,웨어러블데이터,영양기록과같은입력값으로부터지속적으로학습하는살아있는시스템처럼행동한다고설명합니다.이기술은Hevolution과같은재단과RetroBiosciences,AltosLabs와같은기업들로부터수십억달러가장수연구에투입되는시점에등장했으며,이들은생물학적노화를늦추거나역전시키는데투자하고있습니다.​데이터에서동적건강관리로여러기업들이이미에이전틱AI플랫폼의기반을마련하는인프라를구축하고있습니다.토니로빈스와피터디아만디스박사가공동설립한FountainLife는11월11일,자사의ZoriAI의료보조시스템이이제OuraRing,Watch,WHOOP을포함한모든주요웨어러블기기와통합된다고발표했습니다.이플랫폼은이미징,유전체학,대사체학과같은고급진단과함께라이프스타일데이터를종합하여패턴을식별하고잠재적인건강위험을알려줍니다.FountainLife는8월에시리즈B펀딩으로1,800만달러를유치하여연간21,500달러부터시작하는멤버십을제공하는장수센터를확장했습니다.​유전체학선구자인J.크레이그벤터박사가공동설립한HumanLongevityInc.는2024년8월에AI기반건강위험플랫폼을발전시키고전세계로확장하기위해3,980만달러를유치했습니다.한편,InsideTracker는10월에웨어러블과일일저널에서최대15개의변수를분석하여장수개선에가장영향력있는주간습관을식별하는HealthspanHabitsScore기능을출시했습니다.​FDA는2015년부터2025년3월사이에1,000개이상의AI지원의료기기를승인했으며,규제당국은AI지원의료기기용소프트웨어도구를점점더인정하고있습니다.FHIR과같은상호운용성표준은이제웨어러블데이터,검사결과및건강기록을안전하게연결할수있게하여,장수기술을부티크웰니스에서합법적인예방의학으로전환시키고있습니다.​건강수명-기대수명격차해소에이전틱AI에대한추진은전세계적으로건강수명-기대수명격차(질병이나장애를안고살아가는기간)가2000년8.5년에서2019년9.6년으로확대된가운데이루어지고있습니다.미국의경우,이격차는2000년10.9년에서2024년12.4년으로증가하여전세계평균보다29%높습니다.​에이전틱AI의잠재력은개인치료를넘어확장됩니다.연합학습을활용하여이러한시스템은수천명의사용자를연결하여개인데이터를노출하지않고도공통된건강패턴을발견할수있으며,이를통해공중보건기관이질병이발생하기전에예방전략을권장할수있게합니다.의빌게이츠는8월에알츠하이머연구를가속화하는에이전틱AI솔루션을위한100만달러상금경진대회를후원했으며,주최측은이기술이"수년간의연구를압축"할수있는능력을가지고있다고설명했습니다.​그러나전문가들은자동화에대한과도한의존,투명성부족,시스템이너무비싸게유지될경우건강불평등이심화될가능성등의위험에대해경고합니다.Lee는설명가능하고,윤리적이며,포용적인AI,즉사람들이이해하고신뢰할수있는기술을구축하는것이과제라고지적합니다.
1733 조회
0 추천
2025.11.14 등록
(퍼플렉시티가정리한기사)여행계획을위한인공지능사용은지난1년간거의두배증가하여2024년10%에서2025년18%로상승했으며,젊은여행객들이채택을주도하고있고지리적패턴은기술에대한편안함수준에서뚜렷한차이를드러내고있다.​Z세대와밀레니얼세대가이러한변화를주도하고있으며,25세에서34세사이여행객의18%가여행조사를위해AI도구를사용하는반면,55세에서64세사이의경우단3%에불과하다.사용률은중국에서40%로가장높고,미국이27%로그뒤를잇고있어시장간디지털습관이극적으로다르다는것을보여준다.​Claude,최고의AI여행어시스턴트로부상다섯가지주요AI챗봇—ChatGPT,Gemini,Claude,Deepseek,MicrosoftCoPilot—에대한종합테스트결과,여행계획능력에서눈에띄는차이가드러났습니다.Claude는활동,식사,교통비를포함한여행의모든측면에대해상세한예산내역을제공하며두각을나타냈습니다.이챗봇은또한목적지와계절에맞춘짐싸기목록과함께어떤예약을가장미리해야하는지에대한예약팁을제공했습니다.​ChatGPT는각단계마다출처를인용한포괄적인일별여행일정을제공했으며,Gemini는스프레드시트를선호하는여행자를위해"시트로내보내기"기능과함께더깔끔한레이아웃을제공했습니다.MicrosoftCoPilot은각활동과식사에대해여러옵션을제공하는데뛰어났으며,Deepseek는예산을고려하는여행자를위해특정여행사추천과식료품점옵션을제공했습니다.​그러나모든플랫폼은항공편과휴가용렌탈숙소를찾는데한계를보였으며,이는여전히인간여행사와전통적인예약사이트가우위를유지하고있는영역입니다.​신뢰와우려가지속되다채택이증가하고있음에도불구하고,여행자들은AI기반여행계획에대해상당한우려를품고있습니다.33개시장에서37,000명이상의소비자를대상으로조사한Booking.com의글로벌AI감정보고서에따르면,47%는AI가고정관념이나차별을강화하는편향을도입할수있다고우려하고있습니다.또한38%는예산여행자들이이기술에의해우선순위에서밀릴수있다고믿고있습니다.​그러나열의는여전히높으며,89%의소비자가향후여행계획에AI를사용하는것에관심을표명했습니다.여행자의3분의2는AI가여행을더쉽고효율적으로만들것이라고믿으며,67%는이미여행계획이나여행중일부측면에서AI도구를사용했습니다.​이기술은주요여행플랫폼에빠르게통합되고있습니다.2025년10월,OpenAI는Expedia및Booking.com과의파트너십을특징으로하는앱을ChatGPT내에서출시하여,사용자들이챗봇을통해직접여행을검색하고예약할수있도록했습니다.Expedia는11월실적발표에서AI기반개인화및가상상담원이현재고객서비스문의의절반이상을해결하고있다고보고했습니다.​AI가여행산업을계속재편함에따라,기업들의과제는공정성과정확성에대한지속적인우려를해결하는동시에AI를필수적인계획도구로점점더인식하는세대의기대를충족시키기위해혁신과투명성의균형을맞추는것이될것입니다.
1543 조회
0 추천
2025.11.14 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입