Loading...

AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 2026.01.04 14:32
749 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 125 페이지
(퍼플렉시티가정리한기사)MelisaTokmakCEO가이끄는인공지능스타트업Netic이PeterThiel의FoundersFund가주도한2,300만달러규모의시리즈B펀딩라운드를마감하여회사가치가4억5천만달러로평가되었습니다.샌프란시스코에본사를둔이회사는계약업체,배관공,지붕공을위한비즈니스운영자동화AI도구를제공하며,여성주도스타트업이벤처캐피털펀딩의3%미만을차지하는AI부문에서여성창업자들에게드문밝은사례가되고있습니다.​드문신임투표이번펀딩라운드는FoundersFund가Netic을지원한세번째연속투자를의미합니다.이는벤처캐피탈회사가단두개의다른회사,즉AI코딩스타트업CognitionAI와국방기술기업Anduril에만제공한특별한지원입니다.FoundersFund의파트너AminMirzadegan은Bloomberg에회사가이러한반복적인지원을거의제공하지않는다고말하며,중소기업들사이의AI기회가"실리콘밸리에의해간과되었다"고언급했습니다.​Netic의SeriesB는빠른자금조달궤적을따릅니다.이회사는2024년9월GreylockPartners가주도한시드라운드를유치한후,불과4개월후인2025년6월FoundersFund가주도한2천만달러규모의SeriesA를확보했습니다.다른투자자로는HanabiCapital,DayOneVentures,SVAngel,그리고ScaleAI의AlexWang와Figma의DylanField를포함한엔젤투자자들이있습니다.​필수서비스를위한AI지식근로자를대상으로하는AI도구와달리,Netic은Tokmak이"미국경제의중추를이루는산업"이라고부르는분야에집중합니다.이플랫폼은전화,문자,웹채팅및제3자플랫폼을통해고객상호작용을자율적으로처리하며,HVAC,배관,전기및지붕공사부문의비즈니스를위해예약을잡고완전한고객생애주기를관리합니다.​Tokmak의LinkedIn게시물에따르면,지난1년동안Netic은북미전역의서비스산업에서고객들이수십만건의작업을예약하도록도왔습니다.이플랫폼을사용하는한HVAC기업은콜센터직원을두배로늘리지않으면서도90%이상의예약률을유지하고티켓가치를1.6배증가시켰습니다.​ScaleAI에서정부및기업사업부를이끌었으며StanfordUniversity컴퓨터과학졸업생인Tokmak은목요일BloombergTechnology에필수서비스산업이전문화된AI솔루션을필요로하는"심층적인워크플로"에직면해있다고말했습니다.그녀는숙련된기술직을언급하며"이것들은앞으로백년동안대체되지않을일자리입니다"라고말했습니다.​​회사는신규자본을활용하여추가가정서비스부문으로확장하고현재22명으로구성된팀을넘어성장할계획입니다.
1437 조회
0 추천
2025.11.15 등록
(퍼플렉시티가정리한기사)OpenAI는ChatGPT사용자들의오랜불만사항을해결했습니다:이제챗봇은AI생성텍스트의비공식적인특징이된긴구두점기호인em대시사용을피하라는지시를제대로따를것입니다.CEO샘알트먼은목요일밤X에서이수정사항을발표하며"작지만기쁜성과"라고말했습니다.​이번업데이트를통해사용자는개인화설정을통해ChatGPT의작성스타일을맞춤설정할수있지만,챗봇이기본적으로em대시를제거하지는않습니다.이발표는OpenAI가11월11일에최신모델업그레이드인GPT-5.1을출시한지불과이틀후에나왔습니다.​엠대시전염병em대시(emdash)—놀라움이나대조를나타내기위해사용되는긴대시—는AI가생성한텍스트에서너무나흔하게나타나인터넷사용자들이이를"ChatGPT하이픈"이라고부를정도가되었다.이문장부호는학교과제부터업무이메일,링크드인게시물,고객서비스채팅에이르기까지모든곳에서나타나기시작했고,독자들은그빈도를AI콘텐츠를판별하는비공식적인지표로사용하게되었다.​문제는미적인우려를넘어섰다.전문작가들은대형언어모델이등장하기훨씬이전부터존재했던문장부호인em대시를자신의자연스러운글쓰기스타일에포함시켰다는이유만으로AI를사용했다는의심을받게되었다.일부작가들은의심을피하기위해em대시사용을완전히피하기시작했다.​한분석에따르면,이문제는ChatGPT의훈련데이터에서비롯되었을수있다.최첨단모델들은고품질훈련데이터로1800년대후반과1900년대초반의인쇄도서에의존하는데,이러한책들은현대영어산문보다약30%더많은em대시를사용한다.연구에따르면GPT-4.1은이전GPT-3.5-turbo모델보다스토리당약10배더많은em대시를사용했다.​지속적인기술적과제수개월동안사용자들은ChatGPT가해당기호사용을중단하라는요청을명시적으로지시했음에도불구하고무시한다고불만을제기했습니다.OpenAI의커뮤니티포럼은챗봇이em대시금지지시를완고하게거부하는사례들로가득찼으며,이는모델이스타일가이드를처리하는방식에더깊은기술적문제가있음을시사했습니다.​수정사항을적용하려면사용자는개인화설정으로이동하여사용자지정을활성화하고사용자지정지침필드에특정지침을추가해야합니다.OpenAI는Threads게시물에서이논란을인정했으며,회사는ChatGPT가"em대시를망쳐서"사과하도록했습니다.​이번수정은AI개인화및지시수행기능의진전을나타내며,더맞춤화가능한AI경험을향한OpenAI의광범위한노력과일치합니다.
1430 조회
0 추천
2025.11.15 등록
(퍼플렉시티가정리한기사)Activision의최신블록버스터작인CallofDuty:BlackOps7이목요일출시되었으나,연간수십억달러의수익을올리는프랜차이즈임에도불구하고AI생성아트워크의광범위한사용으로광범위한비판을받고있습니다.플레이어들은콜링카드,프레스티지아이콘,게임내포스터에서AI로생성된것으로보이는아트를발견했으며,이는프리미엄가격의게임에서가치와예술적진정성에대한논쟁을촉발시켰습니다.​XboxGamePass에서출시첫날부터이용가능한최초의CallofDuty작품인이70달러짜리타이틀은,플레이어들이빠르게AI생성물로지적한독특한스튜디오지브리스타일의애니메미학을가진콜링카드를특징으로합니다.게임의Steam페이지에는"우리팀은일부게임내자산을개발하는데도움을주기위해생성형AI도구를사용합니다"라고명시된필수AI공개문구가포함되어있습니다.​엇갈린반응과재정적배경이논란은스팀에서미온적인반응을불러일으켰으며,BlackOps7은약45%의긍정적리뷰로"복합적"평가를받고있습니다.소셜미디어의비평가들은전작BlackOps6가2024년미국에서가장많이팔린게임이된Activision이인간아티스트에게보상하는대신AI를사용하여비용을절감하는것에대해불만을표출했습니다.​한Reddit사용자는"그들은AI를사용하므로인간아티스트에게비용을지불하지않아많은돈을절약하지만,게임가격은여전히동일한프리미엄가격입니다"라고썼습니다.이러한비판은GoogleCloud설문조사에서게임개발자의87%가현재어떤형태로든인공지능을사용하고있다고밝힌것처럼,업계의광범위한우려를반영하고있습니다.​회사방위및산업영향Activision은여러매체에대한성명에서자사의관행을옹호하며다음과같이밝혔습니다:"전세계의많은이들과마찬가지로,우리는AI도구를포함한다양한디지털도구를사용하여우리팀이플레이어들에게최상의게임경험을제공할수있도록지원하고있습니다.우리의창작과정은계속해서스튜디오의재능있는인재들이주도하고있습니다".​이번이Activision의첫AI논란은아닙니다.BlackOps6와ModernWarfare3를포함한이전타이틀들도악명높은여섯손가락좀비산타이미지를포함하여AI로생성된에셋을사용했습니다.그러나BlackOps7의스튜디오지브리스타일콜링카드는더욱노골적으로보이며,비평가들은회사가미묘함을포기했다고주장합니다.​이러한반발은생성형AI에점점더의존하는산업에서투명성과가격책정에대한질문을제기합니다.비평가들은게임의세련된멀티플레이어및협동캠페인모드를인정하면서도,많은이들이AI로생성된콘텐츠가정가출시의가치제안을훼손한다고주장합니다.
1382 조회
0 추천
2025.11.15 등록
(퍼플렉시티가정리한기사)샌프란시스코에본사를둔알렘빅테크놀로지스(AlembicTechnologies)는이번주시리즈B투자에서1억4,500만달러를확보하며,AI마케팅분석기업의기업가치를6억4,500만달러로평가받았습니다.이는이전투자라운드대비거의13배에달하는증가입니다.이번라운드는성장지향투자회사프리즘캐피탈(PrysmCapital)과액센츄어(Accentureplc)(pplx://entity_chip/223e851d)가공동으로리드했으며,전드림웍스CEO제프리카첸버그(JeffreyKatzenberg)가공동설립한벤처기업WndrCo도참여했습니다.​알렘빅은마케팅활동을직접적으로매출결과에연결하는‘인과AI(causalAI)’를활용하며,자금의상당부분을업계에서가장빠른민간슈퍼컴퓨터중하나를구축하는데사용할계획입니다.해당슈퍼컴퓨터는엔비디아(NVIDIACorporation)(pplx://entity_chip/5037ac95)NVL72슈퍼POD로,72개의블랙웰GPU가탑재될예정입니다.이시스템은산호세의에퀴닉스(Equinix)데이터센터에설치되어기업의두번째주요컴퓨팅인프라투자로서,양해안(동서해안)복수성을제공하는한편,클라우드공급업체종속을피하는데목적이있습니다.​상관관계를넘어서Alembic의기술은단순한상관관계가아닌인과관계를식별함으로써기존마케팅분석과차별화됩니다.NASA연구원이자CMO로여러기업의인수와IPO를이끈TomásPuig가창립한이플랫폼은원래COVID-19접촉추적을위해개발된첨단신경망및수학적모델을활용합니다.​Puig는VentureBeat와의인터뷰에서“진정한우위를갖추는것은최고의LLM을사용하는것이아니라,경쟁자가접근할수없는독특한정보를활용하는것에달려있다”고말했습니다.​이회사는이미DeltaAirLines,Mars,Nvidia등주요기업고객을유치했습니다.Delta는Alembic플랫폼을통해2024년올림픽후원으로3천만달러의매출을기여한것으로측정했으며,브랜드마케터들이그동안달성하지못했던정밀도를입증했습니다.Mars는판촉을위해캔디바의모양변경이판매에미치는효과를측정하기위해이기술을활용했습니다.​Delta마케팅최고책임자인AliciaTillman은“Alembic의빠르고정밀하며상세한수준에서마케팅노출을직접적으로사업성과와연결시키는능력은우리에게혁신적인파트너십이됐다”고밝혔습니다.​이번투자유치는업계전반에서인과AI에대한관심이높아지는가운데이루어졌습니다.인과AI시장은2023년약2,900만달러로평가됐으며,2032년까지연40%이상의성장률이예상되고있습니다.기업들은상관관계기반예측을넘어인과적예측을추구하기때문입니다.Accenture회장겸CEOJulieSweet는“인과AI는기업이AI를도입하는데있어매우중요하며,규제받는기업들은높은성능과극도의신뢰성을동시에필요로한다”고말했습니다.
1324 조회
0 추천
2025.11.15 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입