Loading...

AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 2026.01.04 14:32
754 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 127 페이지
(퍼플렉시티가정리한기사)OpenAI는목요일인공지능이생물학적위협을만드는무기로전용되는것을방지하는데중점을둔스타트업인RedQueenBio에1,500만달러규모의시드라운드를주도할것이라고발표했으며,이는ChatGPT제작사의한달도안되는기간내두번째주요생물안보투자를의미한다.mRNA치료제회사인HelixNano에서분사한샌프란시스코소재이회사는잠재적인생물무기위협과같은속도로진화하는AI기반방어시스템개발을목표로하고있다.RedQueenBio는공동창립자HannuRajaniemi에따르면,생물학적시스템의취약점을식별하고대응책을설계하기위해컴퓨터모델과실험실테스트를결합할예정이다.​"생물학적역량이우리가예상했던것보다빠르게발전하고있다는것이명백했습니다"라고Rajaniemi는Reuters에말했다."우리는방어책개발을시작해야한다고느꼈습니다".​OpenAI의안전포트폴리오확장이번투자는OpenAI가지난10월뉴욕에본사를둔생물보안소프트웨어회사Valthos에3천만달러를투자한것에이어이루어졌다.OpenAI의최고전략책임자인JasonKwon은회사가유사한위험을다루는추가스타트업을지원하는데열려있다고말했다."우리는전체생태계의전반적인회복력을높이고싶습니다"라고Kwon은Reuters에말했다."위험완화를다룰수있는가장좋은방법중하나는더많은기술입니다".​이번펀딩라운드에는CerberusVentures,FiftyYears,HalcyonFutures도참여했다.거래의일환으로OpenAICEOSamAltman과이사회멤버NicoleSeligman은HelixNano에대한이전투자로인해RedQueenBio의주식을받게되지만,두사람모두이번거래승인에는참여하지않았다.OpenAI의최고컴플라이언스책임자와이해관계가없는이사회구성원들이이번투자를검토하고승인했다.​AI기반위협에맞서는경쟁레드퀸바이오는루이스캐럴의「거울나라의앨리스」에서이름을따왔으며,이는생물학적위협과방어역량간의끊임없는진화적경쟁을의미합니다.이스타트업의창립자들은오픈AI와의협업중최첨단AI모델들이놀라운생물학적창의성을보여주었으며,이는혁신적인치료법개발에활용될수있는가능성을갖는동시에,더어두운잠재력도내포하고있음을관찰했습니다.​안전전문가들은약물개발을가속화할수있는AI시스템이동시에악의적인행위자들이위험한병원체를설계하는장벽을낮출수있다고경고합니다.최근연구에서는합성단백질스크리닝과정에서의취약점이드러났고,여러AI연구소에서생물무기개발정보를제공할위험임계점에다다른모델들에대해우려를표명하고있습니다.​레드퀸바이오는선진AI모델,실험실자동화,강화학습을활용하여AI기반생물학적위협을맵핑하고미리의료대책을개발할계획입니다.이회사는퍼블릭베네핏코퍼레이션구조로설립되었으며,모든AI연구소,바이오제약회사,정부와협력할것을약속합니다.
1319 조회
0 추천
2025.11.15 등록
(퍼플렉시티가정리한기사)인공지능(AI)이심혈관임상시험에서임상사건을전문의수준의정확도로성공적으로판정함으로써,신약개발의비용과복잡성을줄일수있는잠재적전환점을맞고있습니다.연구진은이번주시카고에서열린2025년미국심장협회(AmericanHeartAssociation)연례학술대회에서,AI모델이인간임상사건위원회와동등하게심근경색,뇌졸중,심혈관사망을판별할수있음을발표했습니다.​이번돌파구의중심에는대형언어모델(LargeLanguageModels)과자연어처리(NaturalLanguageProcessing)를활용한두가지첨단AI시스템이있습니다.Auto-MACE모델은PARADISE-MI임상시험에참가한5,661명을대상으로심혈관사망에대해97%,심근경색89%,뇌졸중88%의임상사건위원회와의일치도를보였습니다.한편,심부전자연어처리(HeartFailureNaturalLanguageProcessing)모델은글로벌DELIVER임상시험에서임상의와83%의전체일치도,특히심부전입원판별에서87%의일치도를기록했습니다.​비용이많이드는프로세스간소화임상사건판정은임상시험중특정의료사건이실제로발생했는지확인하는과정으로,일반적으로전문의사패널이의료기록을수작업으로검토해야합니다.이노동집약적인과정은주요비용발생원인으로작용하며,심혈관약물의규제승인임상시험참가자1인당비용이$35,000을초과하기도합니다.​"AI가사람이직접검토해야하는사례의양을줄임으로써,판정비용과일정지연의주요원인을줄일수있습니다."라고브리검여성병원(PabloM.Marti-Castellote외연구진)이그들의JACC논문에서밝혔습니다.Auto-MACE모델은사망사례의69%와잠재적뇌졸중의81%를자신있게판정했으며,불확실한사례에대해서만인간의검토가필요했습니다.​업계영향화이자,존슨앤드존슨,노바티스등제약사들은개발기간과비용감소의수혜를받을것으로보입니다.IQVIA와같은계약연구기관들은이미AI솔루션을도입하고있으며,한설문조사에따르면타당성평가에소요되는시간이90%까지줄었다고합니다.​최근업계분석에따르면,임상시험에AI를통합하면시험당최대70%의비용절감과80%의기간단축이가능하다고합니다.2030년까지AI가임상시험의60~70%에통합될것으로예상되며,이는제약업계에연간200~300억달러의비용절감효과를가져올수있습니다.​마이크로소프트와IBM등테크기업들은임상시험관리를위한AI-서비스형플랫폼개발에유리한위치에있습니다.심혈관연구재단의알렉산드라포프마는Auto-MACE의결과를"환상적"이라며,이는"AI를임상시험의일부로공식적으로도입하는과정의중요한단계"라고평가했습니다.
1355 조회
0 추천
2025.11.15 등록
(퍼플렉시티가정리한기사)이번주주요엔터프라이즈소프트웨어공급업체들의일련의발표는에이전틱AI(지속적인인간감독없이의사결정을내리고행동을취할수있는자율시스템)가파일럿프로젝트에서프로덕션준비플랫폼으로이동했음을알리는신호입니다.11월13-14일,Cisco,Salesforce,NTTDATA를포함한기업들이상당한비용절감과효율성향상을약속하는이니셔티브를공개했습니다.Cisco는AICanvas플랫폼을강화하기위해소형언어모델을전문으로하는시애틀기반스타트업NeuralFabric을인수하겠다는의사를발표했습니다.회사에따르면,NeuralFabric의기술은조직이일반적인대형모델을배포하는것보다"90-99%저렴한"도메인별AI모델을구축할수있게합니다.2026년1월말까지완료될것으로예상되는이번인수는기업들이독점정보의보안을보장하면서공개데이터셋과비공개데이터를결합할수있도록함으로써데이터주권문제를해결합니다.​NTTDATA는11월14일ISGProviderLens에의해에이전틱AI서비스와생성형AI서비스부문모두에서리더로선정되었으며,이는생성형AI카테고리에서2년연속최고인정을받은것입니다.ISG보고서에따르면,회사의SmartAIAgentEcosystem은"30-50%의효율성향상,다운타임감소,고객만족도개선"을제공합니다.이생태계는인프라,오케스트레이션,개발및관찰성을아우르며,프로코드와로우코드개발을모두지원합니다.​조직변화가중심무대에오르다Kyndryl은11월13일인력전환과조직변화관리에초점을맞춘새로운자문서비스를출시했습니다.이회사의에이전틱AI프레임워크는중요한격차를해소합니다:Kyndryl의2025준비현황보고서에따르면,리더의87%가AI가1년내에일자리를재편할것으로예상하지만,인력이준비되어있다고답한비율은29%에불과합니다.​로우코드플랫폼도에이전틱기능을내장하고있습니다.Mendix는AgentsKit과AgentBuilder를도입했고,Appian은대규모에이전트배포를위한AgentStudio를발표했습니다.Deltek은"에이전틱재무마감"기능을포함하여ERP및프로젝트관리시스템전반에걸친에이전틱오케스트레이션을공개했으며,Pipefy는지능형문서처리기능을갖춘Agents2.0을출시했습니다.​데이터보호에멀티에이전트지원추가Druva는AmazonWebServices와파트너십을맺고11월14일데이터보호를위한멀티에이전트코파일럿에대해상세히발표했다.AmazonBedrockAgentCore로구축된이시스템은데이터검색,헬프데스크기능,백업작업시작과같은중요한작업을처리하는특화된에이전트들을특징으로한다.코파일럿은테스트중API선택에서91-93%의정확도를달성했으며,금융서비스사용사례에서조사시간을몇시간에서몇분으로단축했다.​글로벌에이전틱AI시장이2025년72억9천만달러에서2032년883억5천만달러로성장할것으로예상됨에따라이러한발표들이잇따르고있다.
1303 조회
0 추천
2025.11.15 등록
(퍼플렉시티가정리한기사)구글은Gemini앱에새로운기능을도입한다고목요일에발표했다.이기능은사용자가최대세개의참조이미지를업로드하여AI기반영상생성에활용할수있도록한다.구글이"비주얼인그리디언트"라고부르는이업데이트는복잡한텍스트프롬프트를작성하지않아도일관된캐릭터,스타일,그리고장면을가진영상을만들수있게해준다.​이기능은구글의최신영상생성모델인Veo3.1을활용하며,기존Flow영상편집도구와함께Gemini앱에서바로사용할수있다.9to5Google에따르면,해당업데이트는목요일부터점진적으로배포되고있으며,다음주에GoogleAIPlus,Pro,Ultra구독자에게전체제공될전망이다.​비디오제작간소화시각적요소기능은세가지주요창작과제를해결합니다:다양한장면에서캐릭터일관성유지,특정질감과예술적스타일을비디오로전환,그리고사용자의맞춤제작세계와객체일치보장.Google은이기능을AI비디오생성에전통적으로필요했던길고복잡한텍스트프롬프트에대한의존도를줄이는방법으로포지셔닝하고있습니다.​참조이미지는캐릭터,객체,스타일또는장면을묘사할수있으며,Veo3.1은사용자의텍스트지침에따라이를생성된비디오에통합합니다.이접근방식은5월출시이후2억7,500만개이상의비디오를제작하는데사용된Google의전용AI영화제작도구인Flow에서이미사용가능한기능을반영합니다.​10월중순에출시된Veo3.1은이전버전에비해더풍부한오디오생성,더강력한프롬프트준수,그리고더나은이미지-비디오변환품질을포함한여러개선사항을제공합니다.이모델은이제비디오와함께동기화된오디오를생성할수있으며여러샷에걸쳐캐릭터일관성을유지하기위해참조이미지를지원합니다.​구독및경쟁시각적재료기능은구글의AI플러스,프로,울트라요금제가입자들에게제공될예정입니다.구글AI프로는월20달러이며,울트라는월249.99달러이고가장높은사용한도와Veo3에대한접근권한이포함되어있습니다.회사의Gemini앱은최근월간활성사용자수가6억5천만명을돌파했으며,이는3월의3억5천만명에서증가한수치입니다.​이번업데이트는구글이AI영상생성분야에서점점치열해지는경쟁에직면한가운데이루어진것입니다.최근오픈AI가Sora2를출시했고,메타는MovieGen도구를개발중입니다.구글또한최근100만달러상금의AI영화대회를발표했으며,참가자는최소70%이상구글AI로생성한콘텐츠를사용해야합니다.
1310 조회
0 추천
2025.11.15 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입