Loading...

AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 2026.01.04 14:32
475 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 94 페이지
(퍼플렉시티가정리한기사)Google는11월18일,Gemini기반인사이트,실시간전기차충전소예측,향상된발견도구를통해사용자들이바쁜연휴시즌을헤쳐나갈수있도록돕기위해설계된GoogleMaps의네가지새로운기능을공개했습니다.​이번업데이트의핵심은Gemini인공지능을사용하여레스토랑리뷰와온라인정보를주차,비밀메뉴항목,예약추천에대한간결한팁으로종합하는"가기전에알아두기"섹션입니다.현재미국에서Android와iOS에출시되고있는이기능은신뢰도높은세부정보를표면화하여사용자들이수십개의리뷰를스크롤하는수고를덜어주는것을목표로합니다.​향상된검색및EV충전업데이트된탐색탭은스와이프를통해인기있는레스토랑,액티비티및지역명소를보여주는재설계된인터페이스를제공합니다.GoogleMaps는이제Viator,LonelyPlanet,OpenTable의큐레이션목록과함께지역인플루언서의추천을표시하여,한분석가가"원스톱여행일정작성도구"라고묘사한앱으로변모했습니다.​전기차운전자를위해GoogleMaps는다음주부터AndroidAuto및Google이내장된차량에서도착시간의충전기이용가능여부를예측합니다.이기능은AI를사용하여슈퍼차저및ElectrifyAmerica네트워크를포함한전세계수십만개의충전소의과거및실시간데이터를분석합니다.Google은발표에서"Maps가이미현재충전기를이용할수있는지보여주고있지만...그곳에도착할때쯤에는사용중일수있습니다"라고밝혔습니다.​프라이버시중심리뷰최종업데이트를통해사용자들은실명대신닉네임과맞춤프로필사진을사용하여리뷰를게시할수있으며,이는이번달전세계적으로출시됩니다.Google은리뷰가백그라운드에서사용자계정과연결되어있으며,자동화시스템이24시간의심스러운활동을모니터링한다고강조했습니다.
1001 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)PyTorch의공동창시자이자전MetaAI리더인SoumithChintala가전OpenAI최고기술책임자MiraMurati가설립한인공지능스타트업ThinkingMachinesLab에합류했습니다.이번이적은Chintala의Meta에서의11년재직기간의종료를의미하며,현재약500억달러의기업가치로자금조달협상중인Murati의빠르게성장하는벤처에중요한인력영입을나타냅니다.​"[T]hinkingmachines…사람들이정말놀랍습니다"라고Chintala는화요일X에게시하며스타트업에서의새로운역할을확인했습니다.이달초작별인사에서그는PyTorch를이끌며보낸거의8년을회상하며,"아무것도없는상태에서AI분야에서90%이상의채택률"로성장시켰다고밝혔습니다.이오픈소스프레임워크는현재"거의모든주요AI회사의프로덕션환경에서사용되고""MIT에서인도시골까지교실에서가르쳐지고있다"고그는썼습니다.​공격적인AI인재경쟁Chintala의영입은Murati가올해초MetaCEOMarkZuckerberg로부터제안받은것으로알려진10억달러규모의인수제안을거절한지몇달만에이루어졌다.거절이후,Zuckerberg는TheWallStreetJournal에따르면약50명의직원을보유한ThinkingMachines의직원중12명이상에게수년에걸쳐2억달러에서10억달러에이르는보상패키지를제안한것으로알려졌다.​인재영입전쟁은양측모두에게승리를안겨주었다.10월에ThinkingMachines의공동창립자이자전Meta연구원인AndrewTulloch가Murati의스타트업을떠나Meta로복귀했다.그러나Murati는팀대부분을성공적으로유지했으며,이제ChatGPT개발을공동주도한JohnSchulman,연구원AlecRadford,그리고OpenAI의전최고연구책임자BobMcGrew를포함하는명단에Chintala를추가했다.​메타의AI구조조정친탈라의퇴사는메타가AI운영의대대적인구조조정을진행하는가운데발생했습니다.메타는최근ScaleAI의전CEO인알렉산드르왕이이끄는새로운슈퍼인텔리전스랩스(SuperintelligenceLabs)부서로AI팀을통합했으며,이는메타가해당회사에143억달러를투자한이후의일입니다.10월에메타는민첩성과의사결정향상을위해이부서에서약600개의직책을삭감했습니다.​이러한대변동은메타의리더십계층으로도확대되었습니다.메타의수석AI과학자이자기초AI연구소(FundamentalAIResearchlab)설립자인얀르쿤(YannLeCun)은향후몇달내에메타를떠나자신의스타트업을시작할준비를하고있는것으로알려졌습니다.​싱킹머신즈랩(ThinkingMachinesLab)은10월에첫제품인Tinker—대규모언어모델미세조정을위한API—를출시했으며,올해초100억달러가치평가로20억달러를조달했습니다.블룸버그에따르면,이스타트업은현재7월가치평가의4배이상인약500억달러의가치평가로새로운펀딩라운드를진행하기위한초기논의중입니다.
993 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)사이버보안연구원들에따르면,정교한해커그룹이널리사용되는오픈소스AI프레임워크의아직패치되지않은취약점을악용하여수백만달러가치의컴퓨팅클러스터를탈취하고,이를자체증식하는암호화폐채굴봇넷으로변환하고있습니다.OligoSecurity는ShadowRay2.0으로명명된이번캠페인이Ray를표적으로삼고있다고밝혔습니다.Ray는Anyscale이개발하고Amazon,OpenAI,Uber등여러기업에서사용하는AI오케스트레이션프레임워크입니다.이번공격은Ray의인증되지않은JobsAPI에존재하는치명적인취약점CVE-2023-48022를악용하는데,해당취약점은원격코드실행이가능하며아직수정되지않았고공급업체에의해논쟁중입니다.​이번캠페인은2024년3월에발견된초기공격보다훨씬큰규모의확산을보여줍니다.현재연구원들은전세계적으로230,000개이상의Ray서버가노출되어있는것으로집계하고있는데,이는최초ShadowRay발견당시의몇천대와비교해10배이상증가한수치입니다.IronErn440으로추적되고있는위협행위자는처음에는GitLab을통해악성코드를배포했으나,해당인프라가11월5일에폐쇄된후수일만에GitHub로옮겨작전을재개했으며,이캠페인은11월17일기준으로도여전히활동중입니다.​AI가생성한페이로드가프리미엄GPU를노린다이공격은AI로생성된코드를사용해취약한Ray클러스터를식별하고악용하며,특히시간당$3~$4의비용이드는NvidiaA100GPU가장착된시스템을주요클라우드플랫폼에서표적으로삼고있습니다.TheRegister에따르면,연구진은연간400만달러의가치가있는수천대의머신이60%의Ray클러스터에서CPU사용률100%로감염된클러스터를발견했습니다.​"공격자는취약점을악용할필요도없었고,단지설계된대로Ray의기능을사용했을뿐입니다."라고Oligo의연구원인AriLumelsky와GalElbaz는썼습니다."본질적으로피해자의인프라를의도한대로,파이썬코드—이미실행중인애플리케이션처럼—를악의적으로사용하는셈입니다".​악성코드는탐지를피하기위해사용가능한자원의60%로리소스사용량을제한하고,채굴프로세스를정상적인시스템서비스로위장하며,감염된시스템에서경쟁크립토마이너를적극적으로제거합니다.또,15분마다실행되는크론잡(cronjob)과systemd수정으로지속성을유지합니다.​논란이되는취약점으로인해인프라가노출되다CVE-2023-48022는2023년말에처음공개되었지만아직패치되지않았습니다.Anyscale은Ray가"엄격하게통제된네트워크환경"을위해설계되었다고주장하며취약점으로분류하는것에이의를제기하고있습니다.GitHub는악의적인리포지토리에대한통보를받은후허용가능한사용정책을위반한계정을제거했다고확인했습니다.​보안전문가들은이캠페인이암호화폐채굴을넘어데이터유출,자격증명도용,잠재적인분산서비스거부공격까지확장된다고경고합니다.손상된서버중하나에는수년간의회사개발에걸친240GB의소스코드,AI모델및데이터셋이포함되어있었습니다.Oligo연구원들은방화벽규칙을통해Ray클러스터를보호하고,대시보드포트에인증을구현하며,비정상적인활동에대한지속적인모니터링을권장합니다.
892 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)AmazonWebServices는월요일Nvidia의BlackwellUltraGPU를탑재한AmazonEC2P6-B300인스턴스의정식출시를발표했으며,이는고성능AI인프라에대한급증하는수요를충족시키기위한클라우드거대기업의최신노력을보여줍니다.​새로운인스턴스는올해초출시된AWS의이전세대P6-B200인스턴스와비교하여2배의네트워킹대역폭과1.5배더많은GPU메모리를제공합니다.각P6-B300인스턴스는2.1테라바이트의고대역폭GPU메모리,초당6.4테라비트의ElasticFabricAdapter네트워킹,그리고4테라바이트의시스템메모리를갖춘8개의NvidiaB300GPU를탑재하고있습니다.​조단위매개변수모델을위해설계됨AWS에따르면,이인스턴스들은MixtureofExperts및멀티모달처리와같은정교한기술을사용하는대규모AI모델,특히수천개의GPU에걸친분산훈련이필요한수조개의매개변수를가진모델을훈련하고배포하도록설계되었습니다.향상된메모리및네트워킹기능을통해대규모모델이단일NvidiaNVLink도메인내에상주할수있어모델샤딩및통신오버헤드가감소합니다.​P6-B300인스턴스는FSxforLustre와함께NvidiaGPUDirectStorage를지원하여빠른모델로딩을위해초당최대1.2테라비트의처리량을달성합니다.이인스턴스들은현재AmazonEC2CapacityBlocksforML및SavingsPlans를통해미국서부(오리건)리전에서사용할수있습니다.​AI인프라포트폴리오확장이번출시로AWS는경쟁사인Microsoft와Google과경쟁할수있는위치에서게되었으며,이들역시Blackwell기반인프라를출시한바있습니다.Microsoft는11월초4,600개이상의NvidiaBlackwellUltraGPU를탑재한NvidiaGB300NVL72시스템의첫번째대규모프로덕션클러스터를배포한다고발표했습니다.GoogleCloud는10월에Nvidia의RTXPRO6000BlackwellServerEditionGPU를탑재한G4가상머신을정식출시했습니다.​AWS는12월1일부터5일까지라스베이거스에서열리는re:Invent컨퍼런스에서추가적인컨테이너및AI개발사항을선보일예정입니다.
895 조회
0 추천
2025.11.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입