AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 2026.01.04 14:32
484 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 96 페이지
(퍼플렉시티가정리한기사)패션이커머스플랫폼무신사가전사적으로인공지능(AI)기술도입을본격화하며개발자채용을확대한다고19일밝혔다.급변하는이커머스시장에서기술경쟁력을확보하기위해개발,기획,디자인등직무전반에AI도구를도입하고,이를뒷받침할기술인재확보에나서는것이다.​무신사는올해하반기부터'AI리터러시(AILiteracy)'강화를핵심과제로삼고업무전반에AI기술을활용하고있다.무신사,29CM,솔드아웃등팀무신사가운영하는플랫폼의안정적인구축과서비스품질고도화가목표다.​개발부터콘텐츠제작까지AI전면도입테크부문개발인력들은코드생성과분석과정에서AI기반클로드(Claude),커서(Cursor),주니(Junie)등의서비스를활용중이다.플랫폼기획,디자인,운영영역에서도AI를적극활용하고있다.방대한패션빅데이터를통한트렌드분석과마케팅콘텐츠제작에AI기반이미지·영상제작툴을운용하며,일본과중국등해외시장진출과정에서필요한상품후기번역및다국어지원에도AI를활용하고있다.​무신사는지난8월사내AI해커톤'무슨사이(MUSNSAI)'를개최해새로운개발문화를제안했으며,11월13일OpenAI가주최한'데브데이익스체인지서울(DevDayExchangeSeoul)'행사에참가해ChatGPT기반상품추천및후기요약앱,에이전트기반상품추천시스템등을선보였다.​기술인재확보에속도무신사는AI역량강화를위해전용채용플랫폼'무신사커리어스'를통해백엔드,프론트엔드,머신러닝(ML),SRE,데이터분야엔지니어를상시채용하고있다.프로덕트매니저와테크니컬프로덕트매니저등주니어·시니어개발자도모집중이다.​전준희무신사테크부문부사장은"AI리터러시강화는이제선택이아닌필수가됐다"며"기술혁신이무신사의성장을이끄는새로운동력이될것이며,지속적인기술투자를통해국내는물론글로벌시장에서도더나은쇼핑경험을제공하는패션이커머스대표기업이될것"이라고밝혔다.
1000 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)Google는2025년11월18일에Antigravity를공개했습니다.이는에이전트-퍼스트무료통합개발환경으로,AI를단순한보조자에서능동적인개발파트너로격상시킴으로써개발자가소프트웨어를만드는방식을근본적으로변화시킵니다.Gemini3Pro위에구축되었으며,Windsurf에서온기술로구동됩니다.Windsurf의CEO바룬모한과핵심팀은7월에24억달러에Google에인수되었습니다.Antigravity는자율에이전트에게에디터,터미널,브라우저에직접접근할수있도록하며,이들이복잡한소프트웨어작업을독립적으로계획,실행,검증할수있게합니다.​에이전트우선아키텍처가개발자워크플로우를재정의하다기존의AI코드어시스턴트가사이드바를차지하는것과달리,Antigravity는에이전트매니저를주요인터페이스로위치시킵니다.이플랫폼은세가지독특한"서피스"를도입합니다:여러자율에이전트를오케스트레이션할수있는에이전트매니저대시보드,익숙한VisualStudioCode스타일의에디터,그리고에이전트가웹애플리케이션을실시간으로테스트할수있도록스크린샷과녹화를통해깊은크롬브라우저통합을제공합니다.​"Antigravity는개발자가작업공간전반에걸쳐에이전트를관리하면서,기본적으로친숙한AIIDE경험을유지하면서더높은작업지향적수준에서작업할수있도록합니다."라고Google은출시발표에서밝혔습니다.이플랫폼의에이전트는개발자가아키텍처와전략적결정에집중하는동안,새로운기능구현부터코드디버깅,문서생성에이르기까지여러단계의개발작업을자율적으로처리할수있습니다.​이IDE는작업목록,구현계획,브라우저스크린샷,실행녹화등검증가능한결과물인"Artifacts"를도입합니다.이러한투명성메커니즘은에이전트가무엇을만들었고어떻게테스트했는지에대한구체적인증거를개발자에게제공함으로써,단순히완성된코드를보여주는대신AI가생성한코드에대한중요한신뢰의격차를해소합니다.​기업도입가속화초기기업고객들은생산성향상을보고하고있습니다.JetBrains는Gemini3Pro를통합했을때벤치마크작업해결수에서"Gemini2.5Pro대비50%이상개선"을관찰했다고밝혔습니다.GitHub은초기VSCode테스트에서"소프트웨어엔지니어링과제해결정확도가Gemini2.5Pro보다35%높았다"고보고했습니다.​Cursor,Figma,Replit,Shopify,ThomsonReuters등다양한개발플랫폼이이미Gemini3Pro를통합하고있습니다.Box의CTO벤쿠스(BenKus)는Gemini3Pro가"BoxAI가조직지식을해석하고적용하는방식을혁신할새로운수준의멀티모달이해력,계획수립,도구호출을제공한다"고말했습니다.​현재MacOS,Windows,Linux에서무료로공개프리뷰중인Antigravity는Gemini3Pro뿐아니라Anthropic의ClaudeSonnet4.5및OpenAI의GPT-OSS모델도지원합니다.이플랫폼은5시간마다새로고침되는넉넉한속도제한을제공하며,Google은"매우소수의파워유저들"만이제한을경험할것이라고밝혔습니다.
1031 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)TikTok은11월18일사용자들이피드에표시되는AI생성콘텐츠의양을조절할수있도록허용할것이라고발표했으며,이는인공적으로생성된콘텐츠의유입에대한사용자불만에대응하는소셜플랫폼의증가추세에동참하는것이다.이동영상공유앱은또한기존탐지방법을우회하는AI콘텐츠를더잘식별하기위해고급"비가시워터마킹"기술을테스트하고있다.​새로운제어및탐지기술앞으로몇주안에출시될이기능은TikTok의기존"주제관리"도구내의콘텐츠환경설정(ContentPreferences)에서확인할수있습니다.사용자는슬라이더를이동하여스포츠나음식등카테고리피드를사용자정의하듯AI생성콘텐츠를더많이또는더적게볼수있습니다.플랫폼측은이컨트롤이"피드내의콘텐츠를완전히제거하거나교체하는것이아니라,피드내의다양한콘텐츠범위를사용자가조정할수있도록설계된것"이라고밝혔습니다.​TikTok은이제AI생성으로라벨링된동영상이13억개이상에달한다고공개했습니다.이미회사는AI콘텐츠를태그하기위해C2PAContentCredentials(산업전반의메타데이터시스템)을사용하고있지만,이러한라벨은다른플랫폼에서동영상이다시편집되거나업로드될때제거될수있습니다.이번에도입되는새로운보이지않는워터마크는TikTok만읽을수있으며,플랫폼의AIEditorPro도구로생성된콘텐츠와ContentCredentials를포함하는업로드에추가됩니다.​이런조치는핀터레스트(Pinterest)가'AI슬롭'이피드를도배한다는비판을받은뒤,10월에특정카테고리에서AI생성이미지를제한할수있는컨트롤을도입한것과유사합니다.두이니셔티브모두MetaPlatforms,Inc.(메타)와OpenAI가AI로만생성된영상콘텐츠만제공하는전용플랫폼(Vibes와Sora)을론칭하며반대방향으로나아가는시점에등장했습니다.​AI확산에대한산업계의대응TikTok은"AI가개인이창의성을표현하는방식을혁신할수있다고믿는다"고강조하면서도투명성의중요성을강조했다.이회사는책임있는AI관행에초점을맞춘비영리단체인PartnershiponAI,그리고GirlsWhoCode와같은단체들과파트너십을맺어교육콘텐츠를제작하기위한200만달러규모의AI리터러시기금을발표했다.​11월18일더블린에서열린TikTok신뢰및안전포럼에서전문가들은폭력적극단주의자들이플랫폼가이드라인위반을피하는메시지를생성하여콘텐츠조정을회피하기위해생성형AI를사용하고있다고경고했다.이회사는AI라벨링발표와함께독일에서극단주의관련용어를검색하는사용자를위한새로운교육프롬프트를도입했다.
951 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)FoxNewsMedia는지난1년간PalantirTechnologies와협력하여인간기자를대체하지않으면서뉴스룸운영을간소화하도록설계된세가지맞춤형AI기반도구를개발했다고FoxNewsDigital의사장겸편집장인PorterBerry가월요일Axios와의인터뷰에서밝혔습니다.​이번협력은순수한상업적계약으로,FoxNews가지적재산을보호하면서고급AI기능에접근할수있게함으로써경쟁사들과차별화됩니다.AI기업에콘텐츠라이선스를제공하는많은언론기관들과달리,FoxNews는편집자료에대한엄격한통제를유지하여AI파트너가자사의콘텐츠를학습하거나사용할수없도록보장합니다.​세가지도구가디지털워크플로우를혁신하다이파트너십은Fox저널리스트들과함께개발한세가지효율성도구를생산했습니다."토픽레이더"는기자들이진행중인스토리를빠르게파악할수있도록맞춤형브리핑을제공합니다."텍스트에디터"는작성된콘텐츠의스타일준수,효율성,깨진링크를확인하면서FoxNews편집지침준수를보장하는AI강화워드프로세서로기능합니다.세번째도구인"기사인사이트"는디지털기사성과를분석하고최적화전략을제안합니다.​Palantir엔지니어들은약1년전부터뉴스룸의일상운영에참여하여,처음에는FoxNews의워크플로우,데이터시스템및콘텐츠배포프로세스의"디지털트윈"을생성했습니다.그런다음두회사는이러한운영을개선하여,처음에는SEO키워드및태깅과같은반복적인작업을대상으로한후저널리스트가플랫폼전반에걸쳐스토리를발견하고,제작하고,공유하는데도움이되는도구로발전했습니다.​Berry는AI가편집콘텐츠를생성하지않을것이라고강조하며다음과같이말했습니다:"이것은처음부터끝까지인간이하는것이며,AI는중간에통합됩니다".FoxNews는또한ChatGPT와Gemini를포함한추가AI도구를사용합니다.​재무건전성이AI투자를가능하게한다FoxCorp.의가장수익성높은부문인FoxNews는많은언론사들에게는비용이과도하게부담스러울기업AI파트너십을추진할수있는재정적자원을보유하고있습니다.FoxCorp.는2026회계연도1분기매출이전년대비5%증가한37억4천만달러를기록했으며,이는전반적인운영에걸친강력한광고수요에힘입은것입니다.​이번파트너십은방송중심뉴스룸들이텍스트중심매체들에비해AI도입에대체로더신중한태도를보이는가운데이루어졌으며,이는주로저작권및뉴스영상과관련된법적복잡성때문입니다.Berry는이계약을간단히설명했습니다:"비즈니스계약입니다.우리가그들을고용했습니다".
994 조회
0 추천
2025.11.19 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입