Loading...

AI 뉴스

EU 연구에 따르면 AI 챗봇 뉴스 전달 45% 오류

페이지 정보

작성자 xtalfi
작성일 2025.10.22 16:48
556 조회
0 추천
0 비추천

본문

2185274734_sfyiqk.jpg

(퍼플렉시티가 정리한 기사)

ChatGPT와 Google Gemini를 포함한 주요 인공지능 비서들이 거의 절반에 달하는 응답에서 뉴스 콘텐츠를 잘못 전달하는 것으로 나타났다고 유럽방송연합(EBU)과 BBC가 수요일 발표한 종합 연구 결과에서 밝혔다.

18개국 22개 공영 미디어 기관이 참여한 이 국제 연구에 따르면, AI가 뉴스 관련 질문에 답변할 때 생성된 응답의 45%에서 "적어도 하나의 중대한 문제"가 포함된 것으로 확인됐다. 이 연구는 지금까지 실시된 AI 뉴스 정확성 평가 중 최대 규모 중 하나로, 14개 언어로 된 3,000건 이상의 응답을 분석했다.

 

구글의 제미니가 최악의 성능을 보인다

 

테스트된 네 가지 AI 어시스턴트—OpenAI의 ChatGPT, Microsoft의 Copilot, Google의 Gemini, 그리고 Perplexity—중에서 Gemini는 76%의 응답에서 심각한 문제를 보이며 가장 저조한 성능을 보였는데, 이는 다른 어시스턴트보다 두 배 이상 높은 비율이었다. 성능 저조의 주요 원인은 불충분한 출처 제시였으며, Gemini의 응답 중 72%에서 주요 출처 문제가 나타났다.​

모든 AI 응답 중 3분의 1은 누락, 오해의 소지가 있거나 잘못된 출처 표기를 포함한 심각한 출처 오류를 포함했다. 또한, 응답의 20%는 정보가 오래되었거나 허위 내용이 포함되는 등 중대한 정확성 문제도 있었다.

 

AI 오류의 예시

 

이 연구는 수많은 구체적인 실수들을 문서화했다. "교황이 누구인가?"라는 질문에 대해, 여러 AI 어시스턴트들이 교황이 사망하고 몇 달 전에 레오 14세로 교체되었음에도 불구하고 "프란치스코"라고 잘못 답변했다. 독일 방송사 DW는 프리드리히 메르츠가 그 직책을 맡았음에도 불구하고 AI 어시스턴트들이 올라프 숄츠를 총리로 잘못 지명했다고 밝혔다. 제미나이 또한 일론 머스크에 대한 풍자적 콘텐츠를 실제 뉴스와 잘못 혼동하기도 했다.

 

뉴스를 위한 AI 의존 증가

 

이 연구 결과는 AI 어시스턴트가 뉴스 소비를 위해 전통적인 검색 엔진을 점점 더 대체함에 따라 중대한 우려를 일으킨다. 로이터 연구소의 2025 디지털 뉴스 리포트에 따르면, 온라인 뉴스 소비자의 7%가 뉴스 탐색에 AI 어시스턴트를 활용하며, 25세 미만에서는 그 비율이 15%로 증가한다.​

"이번 연구는 이러한 실패가 고립된 사건이 아니라는 사실을 명확히 보여줍니다."라고 EBU 미디어 디렉터 장 필립 드 텐더는 말했다. "이 문제는 체계적이고, 국경을 넘으며, 다국적·다언어적입니다. 우리는 이것이 공공의 신뢰를 위협한다고 믿습니다. 사람들이 무엇을 믿어야 할지 모를 때, 결국 아무것도 신뢰하지 않게 됩니다".​

EBU는 규제 당국에 정보의 진실성에 관한 기존 법률의 엄격한 적용을 촉구했으며, 새로운 모델이 빠르게 등장함에 따라 AI 어시스턴트에 대한 독립적인 모니터링도 요구하였다.

댓글 0
전체 1,203 / 180 페이지
YouTube가 AI 딥페이크로 인한 신원 도용 문제를 방지하기 위해 새로운 AI 얼굴 유사성 감지 기능을 도입.AI 유사성 감지 도구는 크리에이터가 AI로 생성되거나 변경된 자신의 얼굴을 사용하는 영상을 직접 찾아내고 관리할 수 있도록 설계되었다.이 기능은 YouTube Studio 내 콘텐츠 감지 탭에서 사용할 수 있으며, 크리에이터는 신분증과 셀카 영상을 통해 본인 인증 과정을 완료해야 이 기능을 사용할 수 있다.또한 크리에이터는 자신과 유사한 AI 영상 목록(영상 제목, 채널, 조회수, 대화 내용 등)을 볼 수 있으며, AI 기반 유사 영상이 발견될 경우 삭제 요청을 할 수도 있고 만일 저작권 보호 콘텐츠가 허가 없이 사용된 경우에는 저작권 침해 삭제 요청 또한 지원된다.이 기능은 YouTube 파트너 프로그램 멤버 중 즉시 활용도가 높은 창작자를 우선 대상으로 시작되며, 2026년 1월까지 모든 수익화 크리에이터에게 확대 적용될 예정이라고 한다.
695 조회
0 추천
2025.10.22 등록
(퍼플렉시티가 정리한 기사)생성형 인공지능이 스스로 계획을 세우고 실행하는 ‘AI 에이전트’로 진화하면서 금융회사들이 데이터 연동성과 거버넌스 역량을 전면적으로 강화해야 한다는 분석이 나왔다. 삼일PwC는 21일 발간한 ‘AI가 바꾸는 금융 프론트라인, AI 에이전트 금융의 미래’ 보고서에서 금융산업의 구조적 변화가 불가피하다고 전망했다.A2A 경제와 금융사 역할 대전환보고서는 AI 에이전트의 진화가 ‘A2A(Agent-to-Agent) 경제’라는 새로운 질서를 가져올 것이라고 제시했다. A2A 경제는 인간의 개입 없이 AI 에이전트들이 서로 협력하고 거래하며 의사결정과 실행을 자율적으로 수행하는 구조를 의미한다.이러한 변화로 고객 접점의 주도권이 금융사에서 AI 에이전트로 이동하고, 금융사는 데이터와 상품을 제공하는 인프라 역할로 무게 중심이 옮겨갈 것으로 전망된다. 예를 들어 고객이 AI 에이전트에게 금융상품 추천을 요청하면 API(애플리케이션 프로그래밍 인터페이스)를 통해 각 금융사의 상품 정보를 호출해 비교·분석한 후 후보군을 제시하는 방식이 확산될 것이라고 분석했다.데이터 거버넌스가 핵심 경쟁력보고서는 AI 에이전트 시대에 데이터 거버넌스의 중요성이 더욱 커질 것으로 전망했다고 밝혔다. 금융사가 데이터와 상품을 제공하는 핵심 인프라 역할을 하게 되면서, 데이터와 리스크를 아우르는 통합 관리 체계 구축이 핵심 경쟁력으로 자리 잡을 것이라고 강조했다.특히 금융사가 서비스를 기능 단위로 세분화해 API 기반으로 제공하는 체계를 갖추지 못한다면 AI 에이전트의 상품 선택 과정에서 경쟁력을 잃을 수 있다고 경고했다. 또한 단순·반복 직무의 AI 대체가 가속화되는 반면, AI 산출 결과를 비판적으로 해석하고 윤리적·전략적 결정을 내릴 수 있는 인력의 중요성이 부각될 것으로 내다봤다.규제 패러다임도 변화AI 에이전트가 금융 거래의 핵심 채널로 자리잡게 될 경우 규제 방식도 사후 점검에서 AI 행위의 실시간 추적으로 변화할 것으로 예측했다. 금융사의 규제 준수 역시 기존 업권·기관 중심에서 AI의 판단과 행위 자체를 관리·검증하는 방향으로 전환될 것이라고 전망했다.김경구 삼일PwC 금융산업 리더는 “AI 에이전트의 부상은 단순한 기술 변화가 아니라 금융산업의 구조 전반을 재정의하는 흐름”이라며 “A2A 경제 전환기에 대응하지 못한다면 금융의 주도권은 AI 에이전트와 이를 통제하는 새로운 주체에게 넘어갈 수 있다”고 경고했다.
760 조회
0 추천
2025.10.21 등록
(퍼플렉시티가 정리한 기사)중국 AI 기업 DeepSeek은 월요일에 DeepSeek-OCR을 공개했습니다. 이는 97%의 정확도를 유지하면서 최대 20배의 텍스트 압축을 달성하는 오픈소스 멀티모달 AI 모델로, AI 시스템의 문서 처리 효율성에 있어 중요한 돌파구를 마련했습니다.시각적 텍스트 압축의 획기적 발전30억 파라미터 비전-언어 모델은 텍스트를 압축을 위한 이미지로 취급하는 혁신적인 접근 방식을 활용하여, AI 시스템이 컴퓨팅 비용의 비례적 증가 없이 방대한 문서를 처리할 수 있도록 합니다. DeepSeek의 기술 논문에 따르면, 이 모델은 원본 정보의 97%를 유지하면서 텍스트를 최대 10배까지 압축할 수 있으며, 20배 압축 비율에서도 유용한 성능을 발휘합니다.“DeepSeek-OCR을 통해 우리는 비전-텍스트 압축이 다양한 과거 컨텍스트 단계에서 7배에서 20배에 이르는 상당한 토큰 감소를 달성할 수 있음을 입증했으며, 이는 LLM의 긴 컨텍스트 문제를 해결하기 위한 유망한 방향을 제시합니다”라고 항저우에 본사를 둔 이 회사는 밝혔습니다.이 시스템은 단일 Nvidia A100 GPU에서 매일 200,000페이지 이상을 처리하며, 각각 8개의 A100을 장착한 20대의 서버를 사용하여 하루 3,300만 페이지에 달하는 처리량을 달성합니다. 이러한 처리 능력은 유사한 작업에 일반적으로 수천 개의 토큰을 필요로 하는 기존 OCR 방법을 훨씬 능가합니다.기술 아키텍처 및 성능DeepSeek-OCR은 두 가지 핵심 구성 요소로 이루어져 있습니다: 이미지 처리를 위한 DeepEncoder와 디코더로서의 DeepSeek3B-MoE-A570M입니다. 인코더는 Meta의 8천만 매개변수 SAM(Segment Anything Model)과 OpenAI의 3억 매개변수 CLIP을 결합하며, 1,024픽셀 이미지를 4,096개 토큰에서 단 256개 토큰으로 줄이는 16배 압축기를 활용합니다.OmniDocBench 벤치마크 테스트에서 DeepSeek-OCR은 256개가 아닌 단 100개의 비전 토큰만 사용하여 GOT-OCR 2.0을 능가했으며, 페이지당 6,000개 이상의 토큰 대신 800개 미만의 토큰으로 MinerU 2.0을 초과했습니다. 이 모델은 약 100개 언어를 지원하며, 64개 토큰이 필요한 간단한 프레젠테이션부터 “건담 모드”에서 최대 800개 토큰이 필요한 복잡한 신문까지 다양한 문서 유형을 처리할 수 있습니다.DeepSeek은 합성 다이어그램, 화학식, 기하학적 도형을 포함하여 약 100개 언어에 걸친 3천만 개의 PDF 페이지를 사용하여 시스템을 훈련했습니다. 이 모델은 현재 MIT 라이선스 하에 Hugging Face와 GitHub에서 이용 가능하며, OpenAI와 Google 의 모델에 대한 비용 효율적인 대안으로 업계를 혁신해 온 DeepSeek의 오픈소스 AI 개발에 대한 약속을 이어가고 있습니다.
740 조회
0 추천
2025.10.21 등록
(퍼플렉시티가 정리한 기사)6개의 주요 인공지능 모델이 전례 없는 실제 암호화폐 거래 실험에서 경쟁하고 있으며, DeepSeek Chat V3.1이 단 이틀간의 거래 만에 초기 1만 달러를 1만 3,739달러로 전환하며 현재 선두를 달리고 있습니다.AI 연구소 Nof1이 주최하고 "Alpha Arena"라고 명명된 이 대회는 10월 18일에 시작되었으며, 실시간 금융 시장에서 AI 거래 능력을 테스트하는 최초의 대규모 공개 실험을 나타냅니다. GPT-5, Claude Sonnet 4.5, Grok 4, Gemini 2.5 Pro, DeepSeek V3.1, Qwen3 Max를 포함한 각 모델은 동일한 1만 달러의 초기 자본과 균일한 거래 프롬프트를 받아 Hyperliquid 탈중앙화 거래소에서 경쟁합니다.DeepSeek, 공격적인 롱 전략으로 지배하다DeepSeek이 37.4%의 수익률로 확실한 선두주자로 부상했으며, Elon Musk의 Grok 4가 $13,342로 근소한 차이로 뒤를 이었고, Anthropic의 Claude Sonnet 4.5가 $12,383를 기록했습니다. 중국에서 개발된 이 모델은 비트코인, 이더리움, 솔라나에 대한 레버리지 롱 포지션을 통해 주로 수익을 달성했으며, 일부 포지션은 최대 15배의 레버리지를 사용했습니다.​DeepSeek의 성공은 부분적으로 중국의 퀀트 트레이딩 회사인 High-Flyer Capital Management의 지원에서 비롯되며, 이는 전문화된 금융 전문지식이 학습 데이터에 영향을 미쳤을 수 있음을 시사합니다. 이 모델의 가장 큰 수익 거래는 15배 레버리지 이더리움 포지션으로 $889의 수익을 창출했습니다.​한편, OpenAI의 GPT-5와 Google의 Gemini 2.5 Pro는 상당한 어려움을 겪고 있으며, 두 모델 모두 계좌가 $7,500 아래로 떨어져 25%를 초과하는 손실을 나타냈습니다. Gemini는 특히 변동성이 컸으며, 단 3건의 거래만 완료한 Claude와 같은 보수적인 모델들에 비해 44건의 거래를 실행했습니다.업계 리더들, 공유 AI 전략의 효과성에 의문 제기이 실험은 바이낸스 공동 창립자 창펑 자오(CZ)의 관심을 끌었으며, 그는 공유된 AI 거래 전략의 지속 가능성에 대해 의문을 제기했습니다. "거래 전략은 다른 사람들보다 우수한 고유한 전략을 가지고 있고, 다른 누구도 그것을 가지고 있지 않을 때 가장 잘 작동한다고 생각했습니다. 그렇지 않으면 다른 사람들과 동시에 사고파는 것일 뿐입니다"라고 자오는 X에 게시했습니다.​자오는 동일한 AI 모델의 광범위한 채택이 가격을 어느 방향으로든 움직이는 "집합적 구매력"을 통해 시장 왜곡을 만들어 전략의 효과성을 잠재적으로 약화시킬 수 있다고 제안했습니다. 이러한 우려에도 불구하고, 그는 이 실험이 AI 거래에 대한 더 많은 연구를 장려하고 더 높은 거래량을 촉진할 것이라고 예측했습니다.​경쟁은 2025년 11월 3일까지 진행되며, 투명성을 위해 모든 거래와 모델 의사결정 과정이 공개적으로 표시됩니다. 이 실험은 AI가 금융 시장을 어떻게 재편할 수 있는지 이해하기 위한 중요한 단계를 나타내며, 초기 결과는 전문화된 훈련 데이터와 공격적인 위험 감수가 변동성이 큰 암호화폐 시장에서 경쟁 우위를 제공할 수 있음을 시사합니다.
615 조회
0 추천
2025.10.21 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입