Loading...

AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 2026.01.04 14:32
346 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 48 페이지
원격환자모니터링시장의인공지능은폭발적인성장을앞두고있으며,SNSInsider가11월27일발표한보고서에따르면2024년20억8천만달러에서2032년까지145억1천만달러로급증할것으로예상됩니다.이전망은전세계의료시스템이만성질환관리와가치기반의료모델로의전환을위해AI기반모니터링기술도입을가속화함에따라연평균성장률27.52%를반영합니다.​이러한확장은디지털헬스인프라의광범위한모멘텀을반영합니다.2024년10억1천만달러로평가된미국시장만해도2032년까지68억4천만달러에달할것으로예상되며,이는AI연구개발에대한상당한투자와확립된의료IT프레임워크에의해주도됩니다.의료서비스제공자들은머신러닝알고리즘을사용하여실시간으로환자데이터를분석하는웨어러블기기와바이오센서를점점더많이배치하고있으며,이를통해조기개입이가능해지고재입원율이감소하고있습니다.​기술변화와임상적용자연어처리는현재28.6%의시장점유율로기술분야를주도하고있으며,주로의사소견,환자피드백,음성지시등비정형임상데이터를분석하는데사용되고있습니다.그러나,머신러닝은대규모데이터셋을기반으로건강상태악화를정확하게예측하고지속적으로적응할수있는능력덕분에예측기간동안가장빠른성장이예상됩니다.​임상응용분야중에서는당뇨병관리가2024년에21.4%의점유율로시장을선도했으며,이는전세계적인이질병의유병률을반영합니다.정신건강및행동모니터링분야는웨어러블기기와스마트폰에서수집된데이터를AI알고리즘이분석해기분변화,스트레스패턴,불안또는우울의조기신호를감지함에따라인식이확산되어가장빠른성장이기대됩니다.​최근업계동향은이분야의급속한진화를보여줍니다.2025년10월,로열필립스는AI가통합된IntelliVue시스템을통해네트워크전반의환자모니터링을표준화하기위해캘리포니아Hoag병원과10년전략적협력관계를발표했습니다.덱스콤은2025년7월,생성형AI를통해맞춤형식단권장사항을제공하는인공지능기반식사기록기능을G7연속혈당측정기에도입했습니다.메드트로닉은실질적으로부정맥의잘못된알림을줄이는AccuRhythmAI알고리즘을포함해,자사의심장모니터링기기를향상시키기위해다수의AI기업과파트너십을맺고있습니다.​시장역학및지역성장AI기반기기는2024년에41.8%의시장점유율을차지했으며,첨단웨어러블,바이오센서및스마트건강모니터가실시간데이터수집및분석을위해내장AI를빠르게도입하고있습니다.서비스부문은AI기반원격모니터링플랫폼과데이터분석에대한수요증가로인해가장빠른성장이예상됩니다.​2024년북미는52.5%의점유율로시장을주도했으며,아시아-태평양지역은중국,인도및동남아시아전역에서건강관리수요증가,만성질환부담증가및빠른디지털전환으로인해가장빠르게성장하는지역입니다.
563 조회
0 추천
2025.11.28 등록
GoogleBrain창립자AndrewNg은자신이AI를"친구들이알고있는것보다훨씬더많이브레인스토밍동반자로"사용한다고밝혔으며,출퇴근중운전하면서챗봇과장시간음성대화를나누며복잡한아이디어를정리한다고전했다.2025년10월MastersofScaleSummit에서이번주에공개된대화에서Ng은자신의독특한업무방식을설명했다:"운전할때AI와꽤많이대화합니다"라고그는전미국수석데이터과학자DJPatil에게말했다.목적지에도착하면AI에게대화내용을요약하도록요청하고팀에전송한다."운전하면서그냥일을끝냅니다"라고Ng은말했다.​​이AI선구자는단일모델만고집하지않는다.코딩작업의경우ClaudeCode와OpenAI의Codex를번갈아사용하며,더광범위한브레인스토밍에는다양한모델을활용한다."AI는매우똑똑하지만맥락을입력하는것이어렵습니다"라고Ng은설명했다.빠른결과물을요청하기보다는사용자가아이디어를논의하고반복적으로피드백을제공하는"확장된대화"의중요성을강조했다.​​"게으른프롬프팅"이효과가있을때Ng의접근방식은AI에게최소한의맥락이나지시만제공하는"게으른프롬프팅"에대한그의이전발언과대조를이룬다.4월X에올린게시물에서그는이기법이특정시나리오에서효율적일수있다고주장했다."때로는게으르게빠르고부정확한프롬프트를급하게작성해서무슨일이일어나는지보는것이더빠릅니다"라고Ng는썼다."대부분의LLM은당신이그들이이해를돕고해결책을제안하기를원한다는것을알아낼만큼충분히똑똑합니다."​그는게으른프롬프팅이사용자가출력품질을빠르게평가할수있고LLM이충분한기존맥락을가지고있을때가장잘작동하는"고급기법"이라고명확히했다."우리는필요할때만프롬프트에세부사항을추가합니다"라고그는덧붙였다.​경영진을위한AI플레이북Ng는AI를일상업무워크플로우에통합하는경영진의수가증가하는추세에동참하고있습니다.GoogleCEO인SundarPichai는6월에자신이AI를사용하여"바이브코딩"을하고웹앱을구축한다고말하며,이것이코딩을"훨씬더즐겁게"만든다고언급했습니다.BoxCEO인AaronLevie는BusinessInsider에자신이연구를위해ChatGPT나Perplexity를번갈아사용하고,프로토타이핑을위해Cursor를,데이터작업을위해BoxAI를사용한다고말했습니다.BookingHoldingsCEO인GlennFogel은AI를사용하여자신의대중연설기술을개선하며,발표와바디랭귀지에대한피드백을받기위해기조연설녹화본을업로드합니다.​​AI음성기능이향상됨에따라,Ng의차량기반브레인스토밍세션은지식근로자들이이전에는비생산적이었던순간들에AI시스템과점점더협업하게될방식을미리보여줄수있습니다.
591 조회
0 추천
2025.11.28 등록
디지털자산보안기업BitsLab은11월27일전세계5억6천만명의암호화폐사용자들과새롭게부상하는자율AI에이전트생태계에대한위협증가에대응하기위해포괄적인AI기반보안플랫폼을발표했습니다.이발표는한국최대암호화폐거래소업비트가3,600만달러규모의보안사고를공개한가운데나와,디지털자산분야에서고급보호시스템의시급한필요성을부각시켰습니다.​새플랫폼은개발자를위한BitsLabAIScanner와일반사용자를위한BitsLabSafe라는두가지핵심제품,그리고자율적으로운영되는AI에이전트보호를위해새로개발된AgenticSecurityStack을통합합니다.회사에따르면,이시스템은18,000개의내부라벨링샘플,25,000개의정규화된공개샘플,그리고보안감사자가검증한167,000개이상의합성샘플로구성된독점AI보안데이터셋을기반으로작동합니다.이데이터셋은저수준구현결함부터경제적공격까지다양한프로그래밍환경과공격지점을포괄합니다.​BitsLab의AIScanner는개발자워크플로에직접통합되어실시간으로취약점을탐지하고구조화된보안보고서를생성하며,BitsLabSafe는일반사용자를위한AI방화벽으로서악성사이트차단,소셜엔지니어링사기탐지,사용자가거래승인을하기전에위험경고를발송합니다.플랫폼의효율성은글로벌보안테스트플랫폼에서증명되었는데,AIScanner가불과30일만에1,200위권밖에서전세계27위권으로급상승했습니다.​에이전틱경제다루기AgenticSecurityStack은자율적인AI에이전트가야기하는보안문제에대응하기위한BitsLab의대책을의미합니다.전문가들은이를점점더중요한공격표면으로간주하고있습니다.Signal의사장MeredithWhittaker는최근,AI에이전트가민감한정보에접근하고프롬프트인젝션공격에취약하기때문에,안전한메시징에"실존적위협"이된다고경고했습니다.2025년9월,보안업체Anthropic는공격자가AI의에이전트적능력을활용해자율적으로사이버공격을실행한,최초의AI지휘사이버스파이행위를탐지했다고밝혔습니다.​BitsLab의스택은에이전트코드와행동논리를분석하는BitsLabAgentScanner와함께,자율에이전트가특정행동을실행할권한이있는지동적으로판단하는정책계층인BASP(BitsLabAgenticSecurityProtocol)를포함합니다.​Questflow와의파트너십동시에BitsLab은Questflow와의파트너십을발표하여x402결제프로토콜을보안화하고,자율에이전트가안전하게거래를수행할수있도록했습니다.이번협력을통해BitsLab은x402생태계에보안API와보안에이전트를제공하여온체인결제및AI에이전트상호작용에대한실시간보호를제공합니다.​Coinbase가개발한x402프로토콜은HTTP를통한즉시스테이블코인결제를가능하게하여,AI에이전트가API호출및컴퓨팅리소스와같은서비스에대해자율적으로결제할수있도록합니다.Questflow의다중에이전트오케스트레이션프로토콜은여러AI에이전트가실시간으로통신하고거래할수있도록조율합니다.​BitsLab은500개이상의프로젝트를감사했으며,100만줄이상의코드를검토했고,자회사브랜드인MoveBit,ScaleBit,TonBit을통해80억달러이상의디지털자산보안을지원했습니다.회사는2023-24회계연도에237%의매출성장을기록했으며수익성을유지하고있습니다.
564 조회
0 추천
2025.11.28 등록
런던에본사를둔Neuracore는로봇학습플랫폼개발을가속화하기위해300만달러의프리시드(pre-seed)자금을확보했습니다.이플랫폼은로보틱스분야에서기계학습모델을배포하는데걸리는시간을수개월에서며칠로단축하는것을목표로하고있습니다.​이번투자라운드는EarlybirdVentureCapital이주도했으며,HuggingFace의공동창업자이자CEO인ClemDelangue와학계,하드웨어,인공지능분야의자문단이참여했습니다.11월26일자금조달발표와함께Neuracore는전세계대학및연구기관에자사엔터프라이즈플랫폼을무제한으로제공하는무료학술프로그램을출시했습니다.​인프라병목현상해결임페리얼칼리지런던의로봇학습조교수인StephenJames가2024년에설립한Neuracore는로봇공학개발에서지속적인과제를다룹니다:팀들이유사한인프라를처음부터반복적으로재구축하는것.회사에따르면,이러한병목현상은현재엔지니어링시간의최대80%를소비하고있습니다.​"제가함께작업한모든로봇공학팀에서사람들은동일한인프라를처음부터재구축하고있었습니다"라고James는말했습니다."우리의사명은이러한중복을제거하고연구자와기업모두에게파이프라인유지관리가아닌진정한혁신에집중할수있는도구를제공하는것입니다."​Neuracore의클라우드기반소프트웨어스택은회사가단편적인"프랑켄슈타인"로봇공학설정이라고설명하는것을비동기데이터수집,시각화,훈련및배포를처리하는통합시스템으로대체합니다.이플랫폼은이미하드웨어제조업체와의파트너십을포함하여상업및학술로봇공학분야의50개이상의조직에서사용되고있습니다.​업계모멘텀이번자금조달은로봇산업에대한투자자들의관심이급증하는가운데이루어졌습니다.2025년11월,피지컬인텔리전스(PhysicalIntelligence)는56억달러의기업가치로6억달러를유치했으며,글로벌로봇시장매출은2025년에500억달러를초과할것으로전망되고있습니다.​얼리버드벤처캐피탈(EarlybirdVentureCapital)의 Principal인로라발덴스트롬(LauraWaldenstrom)은"로봇산업이중요한전환점을맞고있습니다.ROS1.0시대에서딥러닝이이끄는데이터중심패러다임으로이동하고있습니다"라고언급했습니다.그녀는덧붙여,"뉴라코어(Neuracore)는웹애플리케이션에AWS가제공했던것처럼,신뢰할수있고확장가능한플랫폼을제공합니다"라고말했습니다.
596 조회
0 추천
2025.11.28 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입