AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 2026.01.04 14:32
485 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 100 페이지
(퍼플렉시티가정리한기사)샌프란시스코에본사를둔엔터프라이즈AI스타트업Writer는11월17일,인공지능을대화형도구에서복잡한비즈니스워크플로를자율적으로실행하는시스템으로전환하도록설계된포괄적인자동화플랫폼WriterAgent를공개했다.​이번출시에는반복작업을재사용가능한템플릿으로변환하는Playbooks,자동화된워크플로를예약하는Routines,그리고GoogleWorkspace,Microsoft365,Snowflake,HubSpot을포함한애플리케이션에연결되는엔터프라이즈ModelContextProtocol게이트웨이가포함된다.WriterCEOMayHabib에따르면,이플랫폼은"한명의영업담당자가챗봇에게아웃리치이메일작성을요청하는것과기업이1,000명의담당자모두가브랜드에부합하고규정을준수하며상황을인식하는메시지를타겟계정에보내도록보장하는것사이의차이"를나타낸다.​혼잡한엔터프라이즈시장에서경쟁하기Writer에이전트는10월에AppBuilder와Workflows기능을출시한Microsoft의Copilot,그리고10월에사용자당월30달러에출시된Google의GeminiEnterprise에정면으로도전장을내밀고있다.Anthropic또한10월에Claude모델에맞춤형워크플로우기능을추가하는AgentSkills를선보였다.이러한움직임은챗봇에서엔터프라이즈소프트웨어스택전반에걸쳐다단계작업을수행할수있는자율시스템으로업계전체가전환하고있음을보여준다.​Writer의플랫폼은자체개발한PalmyraX5추론모델을기반으로동작하며,이모델은약1,500페이지에해당하는최대100만토큰컨텍스트윈도우를제공하고,입력을22초만에처리한다.이회사는합성데이터기법을사용해,약7십만달러라는비용으로모델을개발했으며,이는OpenAI가유사시스템에투자한것으로추정되는1억달러의일부분에불과하다.프로덕트매니지먼트디렉터인도리스주(DorisJwo)는브랜드프레젠테이션생성,캘린더요약을Slack과동기화,영업통화분석과같이전통적으로수시간의수작업이필요했던워크플로우데모를선보였다.​엔터프라이즈제어로플랫폼차별화Writer는소비자용AI도구와달리,관리자가웹액세스를제한하고,커넥터권한을관리하며,모든에이전트작업의감사추적을유지할수있도록하는세분화된IT제어기능을강조합니다.2024년11월2억달러규모의시리즈C라운드에서19억달러의기업가치를달성한이회사는컴캐스트,퀄컴,우버,액센츄어등다양한고객사를확보했습니다.NewAmericanFunding의시니어콘텐츠마케팅매니저인KarenRodriguez는WriterAgent가그녀의팀이캠페인업데이트와콘텐츠변환을“몇분만에”자동화할수있게해주며,이를“무엇을해야하는지알려주는AI에서실제로해주는AI로의전환”이라고설명했습니다.​Writer는160%의순유지율을보고하고있으며,올해계약액5,000만달러를두배인1억달러까지늘릴것으로예상합니다.2020년창업초기부터시작된Writer의엔터프라이즈우선전략은연구소중심으로출발한OpenAI와Anthropic와대조적이며,애널리스트들이2030년까지1,000억달러규모로성장할것으로예상하는엔터프라이즈AI자동화시장에서유리한입지를확보하고있습니다.
1052 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)Google는월요일에GenerativeUI를공개했습니다.이는AI모델이정적인텍스트응답을제공하는대신완전히맞춤화된인터랙티브인터페이스를즉석에서생성할수있게하는기술입니다.Gemini앱과GoogleSearch의AIMode에출시되는이기능은개별프롬프트에맞춤화된전체사용자경험을생성함으로써전통적인챗봇경험에서벗어나는변화를의미합니다.​Gemini3Pro로구동되는이기술은모든질문이나지시에대한응답으로웹페이지,인터랙티브도구,게임및시뮬레이션을생성할수있습니다.발표와함께게시된연구논문"GenerativeUI:LLMsareEffectiveUIGenerators"에따르면,인간평가자들은생성속도를고려하지않았을때표준대규모언어모델출력보다이러한AI생성인터페이스를강력하게선호했습니다.​동적인터페이스에대한두가지접근방식Google은Gemini앱에서두가지구현방식을테스트하고있습니다.동적뷰(Dynamicview)는Gemini3의코딩기능을사용하여각프롬프트에맞는맞춤형인터페이스를설계하고코딩하며,컨텍스트에따라콘텐츠와기능을조정합니다.시각적레이아웃(Visuallayout)은사용자가추가로커스터마이징할수있는인터랙티브모듈이포함된매거진스타일의뷰를생성합니다.​회사는연구블로그에서"5세아동에게미생물군집을설명하는것과성인에게설명하는것은서로다른콘텐츠와다른기능세트가필요하다는점을이해하여경험을맞춤화합니다"라고밝혔습니다.​Google검색에서생성형UI기능은미국내GoogleAIPro및Ultra구독자를대상으로AI모드를통해제공됩니다.사용자는모델드롭다운메뉴에서"Thinking"을선택하여특정쿼리에맞춤화된인터랙티브도구와시뮬레이션을생성할수있습니다.​기술적기반및한계이구현은Gemini3Pro를세가지핵심구성요소와결합합니다:이미지생성및웹검색을위한도구액세스,신중하게작성된시스템지침,그리고일반적인오류를해결하기위한후처리.연구를촉진하기위해Google은전문가가설계한웹사이트데이터셋인PAGEN을만들었으며,이는연구커뮤니티에공개될예정입니다.​그러나이기술은한계에직면해있습니다.현재구현은결과를생성하는데1분이상걸릴수있으며,출력물에서때때로부정확성이나타납니다.GoogleFellow인YanivLeviathan과연구논문을공동집필한동료들에따르면,이러한부분은여전히진행중인연구영역으로남아있습니다.​이발표는Google이가장지능적인모델로설명한Gemini3의광범위한출시와동시에이루어졌습니다.Gemini3Pro는LMArena리더보드에서1,501점을기록하며이전버전을능가했습니다.또한이모델은박사수준추론을위한GPQADiamond에서91.9%,도구없이Humanity'sLastExam에서37.5%를달성하는등벤치마크에서강력한성능을보였습니다.
1029 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)Alphabet소유의Waymo는화요일에5개의새로운도시에완전자율주행로보택시를배치할것이라고발표했으며,이는자율주행기술회사로서가장광범위한출시를의미합니다.이서비스는마이애미에서즉시시작되며,댈러스,휴스턴,샌안토니오,올랜도가향후몇주내에뒤따를예정이지만,대중을위한운행은2026년까지이용할수없습니다.​이번확장은자율주행차량기술의중요한전환점을나타내며,Waymo가주요대도시지역에배치를가속화하는동시에최근마이애미,댈러스,휴스턴에서자체로보택시서비스를시작할계획을발표한Tesla로부터증가하는경쟁에직면하고있습니다.​테스트완료,내년공공서비스예정Waymo는5월부터이들도시에서인간운전자가탑승한차량을테스트해왔으며,이를통해자사의자율주행시스템이현지도로상황과교통패턴에관한데이터를수집할수있도록했습니다.11월18일부터는마이애미의차량에서안전운전자를제거하기시작했으며,나머지네도시에서도앞으로몇주안에완전무인운행으로전환할예정입니다.​하지만이초기단계에서는Waymo직원들만이승객으로탑승하게됩니다.회사는피닉스,샌프란시스코,로스앤젤레스,오스틴,애틀랜타등기존서비스지역에서사용했던것과동일한방식을따라2026년쯤이들시장에서일반대중에게도서비스를개방할계획입니다.​샌안토니오의응급구조대원들은이미무인차량과관련된비상상황을처리하기위한전문교육을시작했습니다.샌안토니오소방서의JoeArrington은“어릴때젯슨가족을보며자랐죠.이제쯤이면하늘을나는자동차가나올줄알았는데,”라며농담을했습니다.“아마이것이그다음단계일지도모르겠네요”.​안전기록과증가하는경쟁Waymo는2020년상용서비스를시작한이후1,000만건이상의유료탑승을완료했습니다.이회사는기존시장전역에서매주250,000건이상의이동서비스를제공하고있습니다.​2,530만마일의자율주행을분석한SwissRe연구에따르면,Waymo는인간운전자와비교하여재산피해청구는88%,신체상해청구는92%감소한것으로나타났습니다.별도의회사데이터에따르면Waymo차량은9,600만마일의완전자율주행동안인간운전자보다심각한부상사고가91%적게발생했습니다.​Waymo가자율주행차량시장을선도하고있는가운데,Tesla는같은도시들에서로보택시서비스를출시할계획을발표하여여러시장에서직접적인경쟁구도가형성되었습니다.Tesla는6월에오스틴에서,그직후샌프란시스코에서로보택시운영을시작했지만,일부관할구역에서는현재운전석에안전모니터요원이필요합니다.
1063 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)TaiwanSemiconductorManufacturingCompany는월요일발표한재무자료에따르면,지난2년간미국,일본,독일,중국으로부터약NT$1,470억달러(US$47억1천만달러)의정부보조금을수령했습니다.​세계최대파운드리반도체제조업체는2025년3분기에NT$47억7천만달러를받아올해첫9개월동안총NT$719억달러를수령했습니다.2024년에확보한NT$751억6천만달러와합쳐,TSMC는이제야심찬글로벌제조거점을뒷받침할상당한재정지원을확보했습니다.​보조금이다대륙건설확장을촉진하다보조금은TSMC의해외자회사에배분되었으며주로부동산취득,장비구매,공장건설및운영비용에사용되었습니다.수혜자로는TSMCArizonaCorp.,독일드레스덴의EuropeanSemiconductorManufacturingCo.,구마모토의JapanAdvancedSemiconductorManufacturingInc.,중국의TSMCNanjingCo.가포함됩니다.​애리조나에서TSMC는3개의첨단제조공장건설에650억달러를투자하고있으며,첫번째공장은2024년4분기에4나노미터기술을사용하여양산을달성했습니다.이회사는애리조나주에3개의추가팹,2개의조립공장및연구개발센터를건설하기위해1,000억달러를추가로약속했습니다.CHIPSandScienceAct에따라미국정부는2024년11월에66억달러의직접자금지원을최종확정했으며,TSMC는4분기에15억달러를받았습니다.​구마모토에서TSMC의첫번째팹은2024년말에상업생산을시작했으며,6나노미터생산을목표로하는두번째시설의건설은2027년말까지완료될예정입니다.일본정부는두공장에최대1.2조엔(78억달러)의보조금을제공하고있습니다.드레스덴에서는2024년8월에유럽의자동차및산업부문에공급하기위해2027년완공예정인시설의건설이시작되었습니다.​지정학적압력속에서의전략적다각화이보조금은TSMC가지정학적긴장고조와공급망회복력에대한고객수요속에서대만을넘어생산을다각화하는가운데제공됩니다.회사의자회사들은건설일정및기타투자조건준수를요구하는지방정부와의협정에서명했습니다.​그러나미국상무부가난징시설에대한회사의특별수출허가를철회한후TSMC의중국내사업은불확실성에직면해있으며,이는2025년말까지발효될예정입니다.28나노미터및16/12나노미터공정으로칩을생산하는난징팹은TSMC전체생산능력의약3%를차지합니다.
1026 조회
0 추천
2025.11.19 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입