AI 뉴스

EU 연구에 따르면 AI 챗봇 뉴스 전달 45% 오류

페이지 정보

작성자 xtalfi
작성일 2025.10.22 16:48
1,990 조회
0 추천
0 비추천

본문

2185274734_sfyiqk.jpg

(퍼플렉시티가 정리한 기사)

ChatGPT와 Google Gemini를 포함한 주요 인공지능 비서들이 거의 절반에 달하는 응답에서 뉴스 콘텐츠를 잘못 전달하는 것으로 나타났다고 유럽방송연합(EBU)과 BBC가 수요일 발표한 종합 연구 결과에서 밝혔다.

18개국 22개 공영 미디어 기관이 참여한 이 국제 연구에 따르면, AI가 뉴스 관련 질문에 답변할 때 생성된 응답의 45%에서 "적어도 하나의 중대한 문제"가 포함된 것으로 확인됐다. 이 연구는 지금까지 실시된 AI 뉴스 정확성 평가 중 최대 규모 중 하나로, 14개 언어로 된 3,000건 이상의 응답을 분석했다.

 

구글의 제미니가 최악의 성능을 보인다

 

테스트된 네 가지 AI 어시스턴트—OpenAI의 ChatGPT, Microsoft의 Copilot, Google의 Gemini, 그리고 Perplexity—중에서 Gemini는 76%의 응답에서 심각한 문제를 보이며 가장 저조한 성능을 보였는데, 이는 다른 어시스턴트보다 두 배 이상 높은 비율이었다. 성능 저조의 주요 원인은 불충분한 출처 제시였으며, Gemini의 응답 중 72%에서 주요 출처 문제가 나타났다.​

모든 AI 응답 중 3분의 1은 누락, 오해의 소지가 있거나 잘못된 출처 표기를 포함한 심각한 출처 오류를 포함했다. 또한, 응답의 20%는 정보가 오래되었거나 허위 내용이 포함되는 등 중대한 정확성 문제도 있었다.

 

AI 오류의 예시

 

이 연구는 수많은 구체적인 실수들을 문서화했다. "교황이 누구인가?"라는 질문에 대해, 여러 AI 어시스턴트들이 교황이 사망하고 몇 달 전에 레오 14세로 교체되었음에도 불구하고 "프란치스코"라고 잘못 답변했다. 독일 방송사 DW는 프리드리히 메르츠가 그 직책을 맡았음에도 불구하고 AI 어시스턴트들이 올라프 숄츠를 총리로 잘못 지명했다고 밝혔다. 제미나이 또한 일론 머스크에 대한 풍자적 콘텐츠를 실제 뉴스와 잘못 혼동하기도 했다.

 

뉴스를 위한 AI 의존 증가

 

이 연구 결과는 AI 어시스턴트가 뉴스 소비를 위해 전통적인 검색 엔진을 점점 더 대체함에 따라 중대한 우려를 일으킨다. 로이터 연구소의 2025 디지털 뉴스 리포트에 따르면, 온라인 뉴스 소비자의 7%가 뉴스 탐색에 AI 어시스턴트를 활용하며, 25세 미만에서는 그 비율이 15%로 증가한다.​

"이번 연구는 이러한 실패가 고립된 사건이 아니라는 사실을 명확히 보여줍니다."라고 EBU 미디어 디렉터 장 필립 드 텐더는 말했다. "이 문제는 체계적이고, 국경을 넘으며, 다국적·다언어적입니다. 우리는 이것이 공공의 신뢰를 위협한다고 믿습니다. 사람들이 무엇을 믿어야 할지 모를 때, 결국 아무것도 신뢰하지 않게 됩니다".​

EBU는 규제 당국에 정보의 진실성에 관한 기존 법률의 엄격한 적용을 촉구했으며, 새로운 모델이 빠르게 등장함에 따라 AI 어시스턴트에 대한 독립적인 모니터링도 요구하였다.

댓글 0
전체 1,366 / 89 페이지
알리바바는Qwen대규모언어모델을매우허가친화적인오픈소스라이선스로공개함으로써궁극적으로자사의클라우드컴퓨팅및전자상거래비즈니스에이로운광범위한AI도입을이끌것이라고전망하고있으며,이는회사의AI전략에대한BismarckBrief의분석에근거한것이다.​에어비앤비CEO브라이언체스키는자사가고객서비스에Qwen모델을적극적으로활용한다고밝혔으며,그이유로"우수함","빠른속도","합리적인비용"을꼽았고,플랫폼통합요구사항에"완전히준비되지않은"ChatGPT대신선택했다고설명했다.​Qwen오픈소스모델은전세계적으로6억회이상다운로드됐으며,현재아마존,애플등미국대형기업의AI시스템에도적용되어,알리바바가세계최대오픈소스AI생태계를구축하게되었다.
1184 조회
0 추천
2025.11.21 등록
Microsoft는 파일 정리 및 이메일 전송과 같은 작업을 자동화하도록 설계된 새로운 Copilot Actions AI 기능이 장치를 손상시키고 민감한 데이터를 훔칠 수 있다는 경고를 발표했으며, 이는 빅테크 기업들이 보안 위험을 완전히 이해하기 전에 기능을 출시한다는 비판을 다시 불러일으켰습니다.회사는 특히 공격자가 웹사이트, 이력서 또는 이메일에 악의적인 명령을 삽입할 수 있는 프롬프트 인젝션 취약점에 대해 사용자들에게 경고했으며, 대규모 언어 모델은 이를 정당한 사용자 지시와 구별할 수 없습니다.Open Worldwide Application Security Project는 2025년 LLM 애플리케이션 상위 10대 보안 위험에서 프롬프트 인젝션을 1위 보안 위험으로 선정했으며, 이는 AI 에이전트가 제어 명령과 사용자 데이터를 구분하지 못하는 근본적인 무능력에 대한 업계 전반의 우려를 반영합니다.
1230 조회
0 추천
2025.11.20 등록
Micropolis Holding Co.는 11월 18일 NVIDIA Orin SOC를 탑재한 IP67 등급의 엣지 컴퓨팅 유닛을 출시하여 클라우드 연결 없이도 감시, 객체 감지 및 행동 분석을 위한 온디바이스 AI 처리를 가능하게 했습니다.8GB에서 64GB 구성으로 제공되는 이 견고한 장치는 법 집행, 국경 통제 및 국가 안보 임무를 위해 설계되었으며, 여러 로봇과 센서에 걸쳐 분산 엣지 네트워크로 작동할 수 있습니다[‘.CEO Fareed Aljawhari는 이러한 통합을 통해 Microspot이 “복잡한 AI 모델을 현장에서 즉시 안전하게 처리”할 수 있게 되어, 신뢰성이 타협될 수 없는 중요한 작전에서 실시간 의사결정을 지원한다고 말했습니다.
1227 조회
0 추천
2025.11.20 등록
1950~60년대 미니컴퓨터 붐은 혁신적 반도체 기술의 발전과 소형화 바람을 타고 수많은 신생 기업과 투자 자본이 단일 산업으로 몰렸던 시기였다. 기업들은 앞다투어 성장했지만, 대부분은 처절한 실패로 끝났고 수십억 달러의 손실이 발생하면서 시장이 한 차례 정리되었다. 이 과정에서 궁극적으로 몇몇 상장기업이 20년 가까운 세월 동안 살아남아 산업을 대표하게 되었다.오늘날 AI 붐 역시 유사하게 폭발적 자본 유입과 스타트업 창업이 반복되고 있다. 하지만 과거와 달리 주요 AI 기업들은 IPO(상장) 대신 비상장 상태에서 거대 자본을 유치하며 급격한 가치 상승을 경험 중이다. 그 결과 일반 투자자들은 직접 투자할 기회가 적고, 기업가치 역시 6~9개월마다 두 배 가까이 오르는 등 민간 시장 중심의 과열 양상을 보인다.Commoncog는 단기 버블 여부를 논하기보다는, 기술 산업에서 반복되는 진입-도태 메커니즘과 시간이 걸리더라도 결국 산업 구조가 단단해지는 과정을 주목해야 한다고 강조한다. 미니컴퓨터 붐처럼, AI 붐도 필연적으로 실패와 도태, 점진적 구조 변화를 거치며 장기적으로는 견고한 성장 기반을 남길 것이라는 점이 반복적으로 제시된다.
1250 조회
0 추천
2025.11.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입