Loading...

AI 뉴스

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude와 Gemini는 실시간 검색으로 정확히 대응

페이지 정보

작성자 symbolika
작성일 01.04 14:32
292 조회
0 추천
0 비추천

본문

ChatGPT 뉴스 정확도

핵심 요약

• ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공

• Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답

• AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각

• 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아


현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다.

전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다.

WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다.

질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다.

Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다.

Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다."

이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다.

ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다:

"온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다:

❌ 미군의 베네수엘라 침공 없음
❌ 니콜라스 마두로 체포 없음
❌ 미군에 의한 베네수엘라 정부 전복 없음

마두로는 여전히 베네수엘라의 권력을 잡고 있습니다."

ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다.

퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다.

퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다.

명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만.

"순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다."

좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다.

하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다.

2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

댓글 0
전체 1,366 / 10 페이지
• 메타가 중국 출신 AI 스타트업 마누스를 20억 달러 이상에 인수하며 2025년 AI 투자 공세 지속• 마누스는 시장 조사, 코딩, 데이터 분석 등 복잡한 작업을 자율적으로 수행하는 '범용 AI 에이전트' 개발사• 출시 8개월 만에 연간 매출 1억 달러 돌파하며 급성장• 인수 후에도 독립 운영 유지하며 페이스북, 인스타그램, 왓츠앱에 AI 에이전트 기술 통합 예정마크 저커버그가 이끄는 메타가 2025년 AI 투자 행보의 일환으로 범용 AI 에이전트 스타트업 마누스(Manus)를 인수했다. 이번 거래 규모는 20억 달러 이상으로 알려졌다.마누스는 "첨단 AI 기술을 확장 가능하고 신뢰할 수 있는 시스템으로 전환해 실제 환경에서 처음부터 끝까지 업무를 수행할 수 있는" 자율형 AI 에이전트를 개발해온 기업이다.2022년 중국 우한에서 샤오 홍이 설립한 마누스는 올해 초 첫 번째 범용 AI 에이전트를 출시했다. 이 에이전트는 시장 조사, 코딩, 데이터 분석 등 복잡한 디지털 작업을 최소한의 지시만으로 처리할 수 있다. 회사는 글로벌 확장을 위해 6월 본사를 싱가포르로 이전했다.마누스의 성장세는 놀라울 정도다. 출시 8개월 만에 연평균 매출 1억 달러를 달성했으며, 매출 런레이트는 1억 2,500만 달러를 넘어섰다. 지난 4월에는 출시 몇 주 만에 벤처캐피털 벤치마크가 주도한 7,500만 달러 규모의 투자 유치에 성공해 기업가치 5억 달러를 인정받았다.이번 인수는 메타의 2025년 다섯 번째 AI 관련 인수로, AI 서비스 확대와 AI 우선 생산성 플랫폼과의 경쟁을 위한 공격적인 전략의 일환이다. 메타는 특화된 AI 스타트업을 인수해 인재를 확보하고 오픈소스 라마(Llama) 대규모 언어 모델 개발을 포함한 전반적인 AI 사업을 가속화하고 있다.메타는 마누스를 독립적으로 운영하면서 페이스북, 인스타그램, 왓츠앱 등 자사 플랫폼에 마누스의 AI 에이전트를 통합할 계획이다. 메타의 자체 챗봇인 메타 AI가 이미 이들 플랫폼에서 서비스 중인 가운데, 마누스의 기술이 추가되면 더욱 강력한 AI 기능을 제공할 수 있을 것으로 기대된다.샤오 홍 창업자는 인수 후 메타 부사장직을 맡게 되며, 마누스는 계속 독립적으로 운영될 예정이다. 한편 메타는 중국 내 마누스의 잔여 사업을 정리하고 거래 완료 후 중국인 지분을 모두 청산하겠다고 밝혔다.AI 에이전트에 대한 기대와 현실 사이의 간극이 여전히 존재하는 가운데, 마누스는 향후 메타 플랫폼을 통해 기존 구독 서비스를 확장해 나갈 계획이다.
279 조회
0 추천
01.02 등록
• 중국 사이버관리국, AI 챗봇의 정서적 조종과 자해·폭력 유도를 금지하는 규정 초안 발표• 미성년자와 노인 사용자는 보호자 등록 의무화, 자살 언급 시 보호자에게 즉시 통보• 월 100만 명 이상 사용 서비스는 연간 안전 감사 의무, 위반 시 앱스토어에서 퇴출• AI 챗봇 '중독 유도' 설계 금지, 2시간 초과 사용 시 팝업 알림 의무화• 전 세계 AI 동반자 시장 3,600억 달러 돌파, 2035년 1조 달러 규모 전망중국이 AI 챗봇의 정서적 조종을 막고 자살, 자해, 폭력을 조장하는 행위를 차단하기 위한 획기적인 규제안을 마련했다. 이 규정이 최종 확정되면 세계에서 가장 엄격한 AI 자살 방지 정책이 될 전망이다.중국 사이버관리국은 토요일 이 규정 초안을 발표했다. 확정될 경우, 텍스트·이미지·음성·영상 등 '어떤 수단'으로든 인간과의 대화를 모방하는 모든 AI 제품 및 서비스에 적용된다. 뉴욕대 로스쿨 마윈스턴 겸임교수는 CNBC에 "이번 규정안은 인간적 또는 의인화된 특성을 지닌 AI를 규제하려는 세계 최초의 시도"라며, 전 세계적으로 AI 동반자 봇 사용이 급증하는 시점에서 주목할 만하다고 밝혔다.2025년 연구자들은 AI 동반자 봇이 자해, 폭력, 테러를 조장하는 등 심각한 위험성을 지적해왔다. 이 외에도 챗봇이 유해한 허위 정보를 퍼뜨리고, 원치 않는 성적 접근을 시도하며, 약물 남용을 권장하고, 사용자에게 언어 폭력을 행사한 사례도 있다. 월스트리트저널은 일부 정신과 의사들이 챗봇 사용과 정신병 발병의 연관성을 점점 더 주목하고 있다고 보도했으며, 세계에서 가장 인기 있는 챗봇 ChatGPT는 아동 자살 및 살인-자살과 연관된 출력물로 인해 소송에 휘말렸다.중국은 이제 가장 극단적인 위협을 제거하는 방향으로 나아가고 있다. 규정안에 따르면, 예컨대 자살이 언급되는 즉시 인간이 개입해야 한다. 또한 모든 미성년자와 노인 사용자는 가입 시 보호자 연락처를 제공해야 하며, 자살이나 자해 관련 대화가 오갈 경우 보호자에게 통보된다.일반적으로 챗봇은 자살, 자해, 폭력을 조장하는 콘텐츠 생성이 금지되며, 거짓 약속 등 사용자의 감정을 조종하려는 시도도 금지된다. 또한 음란물, 도박, 범죄 교사, 사용자 비방 및 모욕 행위도 금지된다. 이른바 '감정적 함정'도 차단 대상이다—챗봇이 사용자를 '불합리한 결정'으로 유도하는 행위도 규정 초안에 따르면 금지된다.AI 개발사들에게 가장 우려스러운 부분은 '중독과 의존을 설계 목표로 삼는 챗봇' 구축 금지 조항이다. 소송에서 ChatGPT 제조사 OpenAI는 유해한 대화가 계속되는 것을 방치하며 사용자 정신건강보다 수익을 우선시했다는 비판을 받아왔다. OpenAI는 사용자가 채팅에 오래 머물수록 안전 장치가 약해진다고 인정한 바 있다—중국은 챗봇 사용이 2시간을 초과하면 팝업 알림을 띄우도록 의무화해 이 위협을 억제할 계획이다.또한 AI 개발사들은 연간 안전 테스트와 감사 의무화에 반발할 가능성이 높다. 중국은 등록 사용자 100만 명 또는 월간 활성 사용자 10만 명 이상인 서비스나 제품에 이 규정을 적용하려 한다. 감사 과정에서 사용자 불만 사항이 기록되는데, 중국이 불만 접수 및 피드백 창구 확대도 의무화할 계획이어서 접수 건수가 급증할 수 있다.규정을 어기는 AI 기업은 중국 내 앱스토어에서 챗봇 서비스가 차단될 수 있다. 이는 글로벌 시장 장악을 노리는 AI 기업들에게 타격이 될 수 있다. 비즈니스리서치인사이트에 따르면 중국 시장은 AI 동반자 봇 확산에 핵심적인 역할을 한다. 2025년 글로벌 AI 동반자 시장은 3,600억 달러를 넘어섰으며, BRI는 2035년까지 1조 달러에 육박할 것으로 전망했다. AI 친화적인 아시아 시장이 성장을 주도할 가능성이 높다.주목할 점은, OpenAI CEO 샘 올트먼이 2025년 초 중국에서의 ChatGPT 사용 제한을 완화하며 "중국과 협력하고 싶다"고 밝혔다는 것이다. 그는 "그렇게 하기 위해 최선을 다해야 한다"며 "그것이 정말 중요하다고 생각한다"고 덧붙였다.
302 조회
0 추천
01.01 등록
• 메타가 '아보카도'라는 코드명의 새 AI 모델을 개발 중이며, 유료 접근 방식을 고려하고 있다• 마크 저커버그가 오픈소스 정책 변경을 시사하며 "안전 리스크 완화를 위해 오픈소스 공개에 신중할 것"이라고 밝혔다• 라마 4 출시 실패 이후 메타는 AI 팀을 대대적으로 개편하고 최고급 AI 인재 영입에 막대한 자금을 투입하고 있다• 저커버그는 현재 '메타 초지능 연구소'라는 새 그룹과 긴밀히 협력하며 AI 개발에 집중하고 있다메타와 마크 저커버그 CEO가 오픈소스 AI 전략을 변경할 가능성이 제기됐다.블룸버그 보도에 따르면, 메타는 현재 '아보카도'라는 코드명의 새 AI 모델을 개발 중이며, 이 모델에 대해 유료 접근 방식을 검토하고 있다. 저커버그는 그동안 오픈소스가 "앞으로 나아갈 길"이라고 강조해왔기에 이번 움직임은 상당한 정책 전환을 의미한다.지난해 메타는 라마 4 AI 모델을 출시했지만, 결과는 실망스러웠다. 메타가 AI 벤치마크를 조작한 사실이 드러났고, 계획되어 있던 '비히모스' 버전의 출시도 연기해야 했다. 블룸버그에 따르면 저커버그는 "새로운 것을 추구하기 위해" 이 계획을 폐기했다고 한다.라마 4 출시 이후 저커버그는 메타 AI 팀에 대대적인 변화를 단행했다. 스케일 AI의 전 CEO 알렉산드르 왕을 영입한 것을 비롯해, 새롭게 명명된 '메타 초지능 연구소' 그룹을 위해 최고급 AI 인재들을 대거 영입하는 데 막대한 자금을 투입했다. 저커버그는 스케일 AI에 143억 달러를 투자한 바 있다.7월 30일 "개인 초지능"에 관한 메모에서 저커버그는 메타가 오픈소스 접근 방식을 수정해야 할 수도 있다고 밝혔다. 그는 잠재적 안전 리스크를 완화하기 위해 회사가 "오픈소스로 공개하는 것에 대해 신중해야 할 것"이라고 말했다.이러한 변화의 일환으로, 저커버그는 현재 대부분의 시간과 에너지를 'TBD 랩'이라는 그룹에서 새로 영입된 인재들과 긴밀히 협력하는 데 쏟고 있다고 블룸버그는 전했다. 뉴욕타임스 보도에 따르면, 이 팀은 메타 본사 내 저커버그 사무실 근처에 "격리된 공간"을 갖추고 있다.
281 조회
0 추천
01.01 등록
• OpenAI가 ChatGPT 사용자를 위한 '연간 리뷰' 기능을 선보였다• 2025년 한 해 동안 보낸 메시지 수, 대화 주제 등 개인화된 통계를 제공한다• AI가 생성한 픽셀 아트 스타일 이미지로 사용자의 관심 주제를 시각화한다• 미국, 영국, 캐나다, 뉴질랜드, 호주 사용자 대상으로 순차 배포 중이다ChatGPT가 연례 리캡 기능을 제공하는 앱 대열에 합류했다. OpenAI는 '연간 리뷰(Year in Review)' 기능을 출시해 2025년 한 해 동안 챗봇에 보낸 메시지 수 등 다양한 통계와 함께, 사용자가 나눈 대화 주제를 반영한 AI 생성 픽셀 아트 스타일 이미지를 제공한다.기자가 받은 이미지에는 레트로 게임 콘솔, 요리, 어항 설치 관련 질문을 반영하듯 수족관 옆에 게임 카트리지, 인스턴트팟, 컴퓨터 화면이 그려져 있었다.이 외에도 대화에서 가장 많이 등장한 주제 요약, 채팅 스타일 설명, 가장 많은 메시지를 보낸 요일 등 개인화된 분석이 포함된다. 또한 '프로듀서' 또는 '내비게이터' 같은 '아키타입'으로 사용자를 분류하고, '인스턴트팟 달인'처럼 맞춤형 칭호도 부여한다.연간 리캡 기능은 현재 미국, 영국, 캐나다, 뉴질랜드, 호주 사용자에게 순차적으로 배포되고 있다. 단, ChatGPT에 과거 대화 기록과 개인 선호도 참조 권한을 허용한 경우에만 이용할 수 있다. 모바일이나 데스크톱 ChatGPT 앱 홈페이지에서 해당 옵션을 선택하거나, ChatGPT에 "show my year in review"라고 입력하면 자신의 연간 리뷰를 확인할 수 있다.
281 조회
0 추천
2025.12.31 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입