Loading...

AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 2026.01.04 14:32
494 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 97 페이지
(퍼플렉시티가정리한기사)Microsoft는11월17일Ignite컨퍼런스에서AI에이전트를위한새로운제어플레인을발표했으며,이는이기술거대기업이인간직원에게사용되는것과동일한인프라로자율AI시스템을관리할수있도록포지셔닝하는것입니다.현재공개프리뷰중인FoundryControlPlane은AI개발자를위한ID,정책시행,관찰가능성및보안을단일포털에중앙집중화하여,에이전트를단순한코드가아닌디지털워커로취급하는방향으로의전환을나타냅니다.​이번발표는기업들이보안위험을초래하지않으면서AI에이전트를대규모로배포하는방법을고심하고있는시점에나왔습니다.Microsoft의Agent365는회사의기존ID관리인프라를AI시스템으로확장하여,조직이입력,출력및도구상호작용전반에걸쳐통합된가드레일을통해Microsoft365관리센터를통해에이전트를등록,모니터링및제어할수있도록합니다.​호스팅된에이전트와멀티에이전트워크플로우로엔터프라이즈배포실현FoundryAgentService는이제공개프리뷰로호스팅에이전트를제공하여,개발자들이Microsoft또는타사프레임워크로구축한에이전트를운영오버헤드없이완전관리형환경에서실행할수있게합니다.멀티에이전트워크플로는시각적디자이너또는코드우선API를사용하여다단계비즈니스프로세스를실행하도록특화된에이전트들을조정하며,상태저장협업,복구및디버깅기능이내장되어있습니다.​에이전트는이제내장된메모리기능을통해세션간컨텍스트를유지할수있어외부데이터저장소의복잡성을줄입니다.개발자는공개프리뷰로제공되는Microsoft365및Agent365에에이전트를직접배포하여,엔터프라이즈급거버넌스를활용하면서생산성생태계내의사용자들에게도달할수있습니다.​보안통합은개발과운영을연결합니다Microsoft는또한GitHubAdvancedSecurity와MicrosoftDefenderforCloud간의통합을공개프리뷰로도입하여런타임인텔리전스를개발자워크플로우와연결했습니다.보안팀은DefenderforCloud에서직접취약점세부정보와함께GitHub이슈를열고추적할수있으며,개발자는GitHub내CopilotAutofix를통해AI가제안하는수정사항을받습니다.​양방향통합은런타임위협을코드의소스에매핑하여팀이이론적위험보다악용가능한취약점의우선순위를정할수있도록합니다.Microsoft에따르면올해AI코딩에이전트를사용하여5억개이상의풀리퀘스트가병합되었습니다.​FoundryControlPlane은MicrosoftEntraAgentID,Defender및Purview의신호를통합하여ID관리,정책기반액세스및실시간위험탐지를제공합니다.Foundry에서생성된에이전트는빌드시MicrosoftEntraAgentID를받으며,상태,비용,성능및정책적용범위에대한플릿전체가시성과함께ControlPlane에자동으로표시됩니다.
1099 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)18일(현지시간)뉴욕증시가인공지능(AI)관련기업의고평가논란과엔비디아의3분기실적발표를앞둔경계감속에일제히하락했다.다우존스30산업평균지수는전날보다498.50포인트(1.07%)내린4만6091.74에,S&P500지수는55.09포인트(0.83%)하락한6617.32에거래를마쳤다.기술주중심의나스닥종합지수는275.23포인트(1.21%)밀린2만2432.85를기록하며S&P500지수기준4거래일연속약세를이어갔다.​구글CEO"AI거품붕괴시모든기업타격"순다르피차이구글최고경영자(CEO)는이날BBC와의인터뷰에서AI거품이터질경우"구글을포함해면역이있을회사는없다"고경고했다.그는"인터넷산업전체적으로돌아보면분명히과도한투자가많이있었고AI도마찬가지일것"이라며"이성적인부분과비이성적인요소가모두있다"고지적했다.JP모건체이스의대니얼핀토부회장도"AI부문에가격조정이있을것이며,이는S&P500지수와업계전체에영향을미칠것"이라고언급했다.​기술주일제히하락,투자자들엔비디아실적에주목AI대장주엔비디아는2.81%하락했으며,마이크로소프트는2.70%,아마존은4.43%각각떨어졌다.엔비디아는19일장마감후3분기실적을발표할예정이다.시장에서는3분기매출을약570억달러,주당순이익을1.28달러로전망하고있다.옵션시장에는실적발표후주가가상하방7%변동할가능성이반영돼있으며,이는시가총액기준최대3200억달러(약430조원)규모의변동을의미한다.​피터틸의헤지펀드가3분기보유중이던엔비디아주식53만7742주를전량매각한사실이알려지면서투자심리가더욱위축됐다.9월말종가기준약1억달러(약1460억원)규모다.앞서소프트뱅크도엔비디아주식3210만주(58억3000만달러)를전량처분한바있다.​대형유통체인홈디포는올해연간조정주당순이익이전년대비5%하락할것이라는전망을내놓으며6.02%급락했다.기존전망치였던2%감소에서하향조정한것으로,관세영향과주택경기둔화가원인으로지목됐다.​연방준비제도(Fed)의12월금리인하가능성도불확실해지면서투자심리를짓눌렀다.시카고상품거래소(CME)페드워치에따르면12월금리인하가능성은약50%수준으로떨어진상태다.한편비트코인은장중한때9만달러선아래로내려갔다가이후9만3000달러대로회복했다.
1118 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)Microsoft는최신Windows11기능에대해강력한경고를발표하며,사용자가활성화할경우작업자동화를위해설계된AI에이전트가실수로악성코드를설치하거나민감한데이터를유출할수있다고주의를당부했습니다.이기술대기업은2025년11월16일,WindowsInsiders에게"실험적에이전트기능"의미리보기버전을배포하면서경고를발표했습니다.발표와함께게시된지원문서에서Microsoft는이러한AI기능이악성코드설치및데이터유출가능성을포함하여"새로운보안위험을초래한다"고명시적으로인정했습니다.​경고의핵심은크로스프롬프트인젝션(XPIA)이라는취약점으로,문서나사용자인터페이스요소에포함된악성콘텐츠가에이전트의명령을무효화할수있습니다.Microsoft는공식문서에서"UI요소나문서에포함된악성콘텐츠가에이전트명령을무효화하여데이터유출이나악성코드설치와같은의도하지않은작업을초래할수있습니다"라고밝혔습니다.​기본적으로비활성화됨이러한위험에대응하여Microsoft는AI에이전트기능을기본값이아닌선택사항으로만들었습니다.회사는사용자들이"보안영향을이해하는경우에만이기능을활성화해야한다"고강조했습니다.이러한실험적기능에대한토글은설정>시스템>AI구성요소아래에나타나며,관리자만활성화할수있습니다.​활성화되면새로운AgentWorkspace는AI에이전트를위한별도의사용자계정을생성하여,문서,다운로드,바탕화면,비디오,사진및음악을포함한개인폴더에대한제한된액세스권한을부여합니다.이러한에이전트는사용자의기본데스크톱과병렬로격리된환경에서작동하여,사용자의주세션을방해하지않으면서파일정리,약속예약또는이메일전송과같은작업을완료할수있습니다.​보안안전장치Microsoft는위험을완화하기위해여러보안제어를구현했습니다.모든에이전트작업은사용자의승인을받아야하며"변조방지감사로그"에기록됩니다.각에이전트는사용자계정과별도의고유한ID를받아,IT관리자가에이전트활동을사람의행동과구별하여추적할수있습니다.​이번발표는Microsoft의Ignite2025컨퍼런스에서이루어졌으며,회사는Windows를"에이전트기반OS"로만들겠다는비전을상세히설명했습니다.그러나이계획은Microsoft가AI기능보다안정성과성능을우선시해야한다고주장하는사용자들의비판에직면했습니다.​보안전문가들은AI에이전트가기능적한계에직면하고때때로예상치못한출력을생성하는"환각"현상을보일수있지만,단계적출시접근방식은Microsoft가이기술의위험성을인식하고있음을보여준다고지적합니다.이러한기능을활용할것으로예상되는첫번째AI애플리케이션은CopilotActions이지만,현재프리뷰상태에서이기능을지원하는앱은없습니다.
1037 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)브라질벨렝에서열린유엔기후정상회의에서인공지능이쟁점으로떠올랐으며,기술대기업들은이를기후해결책으로홍보하는반면환경단체들은급증하는에너지수요와탄소발자국에대해경고하고있다.이논쟁은COP30의핵심긴장을강조한다:인공지능이기후행동을위한혁신적도구인지,아니면2015년파리협정이설정한지구온난화목표를훼손할수있는환경적위협인지에대한것이다.​기술산업계,AI의기후잠재력강조Google과Nvidia의대표들은11월21일까지진행되는회의에서패널토론을통해AI의역량을옹호했습니다.Google의지속가능성책임자AdamElman은AI를"이미영향을미치고있는진정한촉진자"라고묘사했으며,Nvidia의지속가능성책임자JoshParker는이를"우리모두가가질수있는최고의자원"이라고불렀습니다.​AssociatedPress는회의첫주동안에너지그리드최적화부터산림범죄예측까지다양한응용분야를다루는최소24개의AI관련세션을집계했습니다.또한회의는Savannakhet지방의물부족문제를해결하기위해AI기반관개시스템을개발한라오스의AlisaLuangrath에게첫AIforClimateActionAward를수여했습니다.​독일대표단의데이터과학자JohannesJacob은소규모대표단이수백개의공식COP문서를처리할수있도록돕기위해설계된프로토타입앱NegotiateCOP를소개하며"협상에서공정한경쟁의장을마련"하는것을목표로한다고밝혔습니다.​환경단체들,에너지비용에대해경고환경옹호론자들은AI의증가하는환경영향에대한우려를제기해왔습니다.국제에너지기구(IEA)에따르면,데이터센터는2024년전세계전력소비의약1.5%를차지했으며,2017년이후전력사용량이연간약12%씩증가하여전체전력소비보다4배이상빠른속도로증가하고있습니다.​생물다양성센터(CenterforBiologicalDiversity)의에너지정의담당이사인진수(JeanSu)는AI를"전세계적으로완전히규제되지않는괴물"이라고표현했습니다.그녀의조직이10월에발표한보고서는현재추세가계속될경우미국데이터센터가2035년까지연간3억5천만톤이상의CO2를배출할수있으며,이는미국기후목표에따라허용되는전력부문배출량의44%를차지할것으로예측했습니다.​COP30에참석한환경단체들은제안된데이터센터에대한의무적공익평가와100%현장재생에너지요구사항을포함한규제를추진하고있습니다.수는"COP는AI를일종의기술솔루션으로만볼수없으며,심각한기후결과를이해해야합니다"라고말했습니다.
1098 조회
0 추천
2025.11.19 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입