Loading...

AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 01.04 14:32
323 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 32 페이지
구글 [GOOG -1.00%]의 제미나이3 출시 이후 국내 AI 챗봇 시장이 급변하며, 제미나이의 주간 신규 설치 건수가 첫째주 5만967건에서 둘째주 11만1115건으로 두 배 이상 급증한 반면 챗GPT는 3주 연속 신규 설치 감소세를 보였다.11월 17일 제미나이3 출시를 기점으로 제미나이의 주간 활성 이용자는 1만6196명에서 2만2928명으로 급증했으며, 챗GPT는 여전히 875만명 수준의 압도적 규모를 유지하고 있으나 성장 둔화 조짐을 보이고 있다.전문가들은 현재의 ‘1강 다약’ 구도가 ‘2강 다약’ 체제로 변화할 가능성이 있다고 전망하며, AI 검색 모델 퍼플렉시티는 같은 기간 이용자가 45만5659명에서 43만6480명으로 감소하는 등 뚜렷한 하락세를 나타냈다.
424 조회
0 추천
2025.12.14 등록
노코드 인공지능 플랫폼 시장은 MarketsandMarkets™가 12월 12일 발표한 시장 분석에 따르면 2024년 49억 달러에서 2029년 247억 달러로 급증하며 폭발적인 성장세를 보일 것으로 전망됩니다. 이 예측은 연평균 성장률 38.2%를 나타내며, 혁신의 기술적 장벽을 제거하는 접근 가능한 AI 솔루션에 대한 수요 증가가 성장을 견인하고 있습니다.​이러한 플랫폼은 컴퓨터 비전, 자연어 처리, 딥러닝, 예측 분석을 포함한 첨단 기술을 민주화하고 있으며, 프로그래밍 전문 지식이 없는 사용자도 직관적인 드래그 앤 드롭 인터페이스와 시각적 워크플로를 통해 AI 애플리케이션을 구축할 수 있도록 지원합니다. 이러한 접근성은 의료, 금융, 소매, 제조업 등 다양한 분야의 기업들이 AI 기반 솔루션을 구현하는 방식을 변화시키고 있습니다.시민 개발자 역량 강화노코드 AI 플랫폼은 비기술 전문가인 "시민 개발자"가 이제 독립적으로 정교한 애플리케이션을 만들 수 있도록 지원함으로써 개발 환경을 재편하고 있습니다. Forrester는 2025년까지 시민 개발자가 생성형 AI 기반 자동화 애플리케이션의 30%를 제공할 것으로 예측합니다. 이 기술은 텍스트, 이미지, 비디오, 오디오 및 멀티모달 입력을 포함한 여러 데이터 모달리티를 처리하여 감정 분석 및 이미지 인식과 같은 복잡한 작업을 단순화합니다.​주요 기술 기업들이 이 분야에서 적극적으로 경쟁하고 있습니다. IBM, Microsoft, Google, Amazon Web Services, 그리고 Salesforce가 C3 AI, H2O.ai, DataRobot, Dataiku, Qlik을 포함한 전문 벤더들과 함께 시장을 주도하고 있습니다. 2025년 1월, IBM은 노코드 플랫폼에 통합된 향상된 AI 기능을 발표했으며, Microsoft는 개선된 AI 통합으로 Power Platform을 확장했습니다.애플리케이션이 도입을 이끈다챗봇과 가상 비서는 AI를 활용하여 고객 상호작용을 혁신하면서 2024년에 가장 큰 시장 점유율을 차지할 것으로 예상됩니다. 다른 주요 응용 분야로는 워크플로우 자동화, 예측 리드 스코어링, 시각 인식 등이 있습니다. 은행, 금융 서비스 및 보험 부문은 특히 빠른 성장을 경험하고 있으며, 기관들은 광범위한 IT 개입 없이 대출 처리, 사기 탐지 및 위험 평가를 위해 노코드 AI를 사용하고 있습니다.​신흥 플랫폼들은 시장의 진화를 보여줍니다. KuaFuAI의 CodeFlying은 50만 명 이상의 크리에이터와 자연어 프롬프트로부터 관리 백엔드를 포함한 풀스택 애플리케이션을 자동으로 생성하는 모바일 우선 AI 앱 빌더를 통해 생성된 100만 개의 앱을 보고하고 있습니다. 이 플랫폼은 160억 줄의 AI 코드를 생성했습니다.​​시장 조사 기업 Grand View Research는 노코드 AI 플랫폼 시장이 2024년에 42억 8천만 달러에 달했으며 연평균 성장률(CAGR) 30.2%로 2033년까지 441억 5천만 달러로 성장할 것으로 예측하고 있습니다. 한편 다른 분석가들은 시장의 역동적인 특성을 반영하여 다양한 궤적을 예측하고 있습니다.
404 조회
0 추천
2025.12.13 등록
전설적인 게임 디렉터 히데오 코지마는 게임 개발에서 인공지능에 대한 자신의 입장을 명확히 했으며, 시각적 콘텐츠 생성보다는 적응형 제어 시스템에 AI를 사용하는 것에 관심이 있다고 밝혔다. 목요일 CNN과의 인터뷰에서 메탈 기어 솔리드와 데스 스트랜딩의 크리에이터는 자동화된 콘텐츠 생성보다는 지능형 시스템을 통해 더 역동적인 게임플레이 경험을 만드는 데 중점을 두고 있다고 강조했다.​"AI가 시각 자료를 생성하도록 하는 것보다, 저는 제어 시스템 내에서 AI를 사용하는 것에 더 흥미를 느낍니다"라고 코지마는 CNN에 말했다. 그는 100명의 플레이어가 게임에 참여하면, 각자가 캐릭터를 조작하고 환경을 탐색하는 방식에서 고유한 습관과 성향을 보인다고 설명했다. "AI를 활용하여 이러한 차이를 조정함으로써 게임플레이가 더 깊이 있는 수준에 도달할 수 있습니다"라고 그는 말했다.​더 똑똑한 적, 더 깊이 있는 게임플레이코지마의 비전은 AI를 사용하여 논플레이어 캐릭터의 행동을 더 현실적이고 반응적으로 만드는 것에 중점을 두고 있습니다. "대부분의 게임에서 적들은 실제 인간처럼 행동하지 않습니다"라고 그는 언급했습니다. "하지만 AI를 통해 적의 행동은 플레이어의 경험, 행동, 패턴에 따라 적응할 수 있습니다. 이러한 역동적인 반응성은 훨씬 더 풍부한 게임플레이를 가능하게 할 수 있습니다."​이러한 발언은 AI 도입을 둘러싼 게임 업계의 지속적인 긴장 속에서 나왔습니다. 비디오 게임 배우들은 자신들의 목소리와 초상권에 대한 무단 AI 복제에 대한 보호 조치를 확보한 후 2025년 7월 11개월간의 파업을 마무리했습니다. SAG-AFTRA 회원의 95%가 비준한 이 합의는 AI 디지털 복제본에 대한 동의 및 공개 요구 사항을 확립했습니다.기술에 대한 일관된 입장고지마의 입장은 이전 발언들과 일관된 상태로 남아 있다. 2025년 10월, 그는 AI를 효율성을 높이고 개발 비용과 시간을 줄이기 위해 “지루한 작업”을 처리해 줄 수 있는 “친구”라고 표현하면서도, 자신은 계속해서 제작의 “창의적인 부분을 주도할 것”이라고 강조했다. 그는 AI를 “그냥 사용하는 것이 아니라 함께 만들어 간다”는 점을 강조했다.​게임 개발에서 AI의 역할을 둘러싼 논쟁은 2025년 내내 격화되어 왔다. 에픽게임즈 CEO 팀 스위니는 11월, AI가 “앞으로 거의 모든 제작 과정에 관여하게 될 것”이라면서, 디지털 스토어에서의 AI 사용 공개 라벨이 과연 의미가 있는지에 대해 의문을 제기했다. 한편, 12월에는 커뮤니티의 반발 끝에 《Postal: Bullet Paradise》가 취소되는 등, 미공개 AI 사용 의혹을 둘러싼 굵직한 논란들이 잇따라 터져 나왔다.​​고지마의 접근 방식은 인간의 창의성이 AI에 의해 대체될 것이라는 우려와 대비된다. 2001년에 발매된 그의 작품 《메탈 기어 솔리드 2》는 AI의 통제, 정보 조작, 알고리즘적 영향력이라는 주제를 선견지명 있게 다뤘는데, 이는 현대 사회에서 기술이 미치는 영향에 대한 논의에서 점점 더 중요한 화두가 되고 있다.​​고지마의 최신작인 《데스 스트랜딩 2: 온 더 비치》는 2025년 6월 플레이스테이션 5 독점으로 발매되었다.
401 조회
0 추천
2025.12.13 등록
Google [ -1.03%]은 Vertex AI에서 Gemini 2.5 Flash Native Audio 모델을 기반으로 하는 Gemini Live API를 출시하여, 기업들이 별도의 텍스트 음성 변환 없이 오디오를 네이티브로 처리하는 실시간 음성 및 비디오 에이전트를 구축할 수 있도록 했습니다[cloud.google +1].업데이트된 모델은 ComplexFuncBench Audio 벤치마크에서 함수 호출 정확도를 71.5%로, 명령 준수율을 84%에서 90%로 향상시켰으며, 자연스러운 대화 전환, 감정 감지, 시각 데이터 분석과 같은 기능을 포함합니다[cloud.google +1].United Wholesale Mortgage의 AI 어시스턴트는 2025년 5월 이후 14,000건 이상의 대출을 생성했으며, Shopify [ -0.37%]는 사용자들이 “1분 안에 AI와 대화하고 있다는 사실을 종종 잊는다”고 회사의 제품 담당 부사장이 밝힌 멀티모달 어시스턴트 Sidekick을 개발했습니다[cloud.google +1].
421 조회
0 추천
2025.12.13 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입