Loading...

AI 뉴스

머스크의 그로키피디아, 극우 출처 인용한 것으로 연구 결과 밝혀져

페이지 정보

작성자 xtalfi
작성일 2025.11.18 16:16
849 조회
0 추천
0 비추천

본문

2243669565_gz4v3r.jpg

(퍼플렉시티가 정리한 기사)


일론 머스크의 출시한 지 한 달 된 위키피디아 대체 서비스인 그로키피디아(Grokipedia)가 수천 개의 "의심스러운" 그리고 "문제가 있는" 출처를 인용하고 있어 AI 기반 백과사전의 신뢰성에 대한 심각한 의구심을 불러일으키고 있다고 코넬 테크 연구진이 금요일 발표한 연구 결과가 밝혔다.​

연구에 따르면 위키피디아에서 복사되지 않은 그로키피디아 문서는 영어 위키피디아 커뮤니티에서 "일반적으로 신뢰할 수 없는" 것으로 간주되는 출처를 인용할 가능성이 3.2배 더 높고, 위키피디아가 완전히 차단하는 "블랙리스트" 출처를 포함할 가능성이 13배 더 높은 것으로 나타났다. 인용 중에는 스톰프론트(Stormfront)와 인포워즈(InfoWars)를 포함한 극우 매체에 대한 수십 건의 참조가 포함되어 있다.​

코넬 테크 연구진인 해롤드 트리드먼(Harold Triedman)과 알렉시오스 만차를리스(Alexios Mantzarlis)는 보고서에서 "그로키피디아에서는 출처 관련 안전장치가 대부분 제거된 것이 분명하다"고 썼다. "이로 인해 의심스러운 출처가 포함되고, 잠재적으로 문제가 있는 출처의 전반적인 비율이 더 높아지게 된다."​


논란 속에 출범한 위키백과 경쟁 서비스

머스크의 회사 xAI는 10월 27일 80만 개 이상의 AI 생성 기사를 담은 그로키피디아를 출시하며, 머스크가 "위키피디아보다 엄청난 개선"이라고 부른 것으로 포지셔닝했다. 이 억만장자는 오랫동안 위키피디아를 좌파 편향이라고 비난해왔으며, 이를 "Wokepedia"라고 부르고 작년에 2억 명 이상의 X 팔로워들에게 비영리 단체에 기부를 중단할 것을 촉구했다.​

그러나 이 플랫폼은 정확성 문제로 빠르게 비판을 받았다. PolitiFact는 그로키피디아가 존재하지 않는 출처를 인용하거나 참조된 정보를 포함하지 않는 출처를 인용하는 등 허위 인용을 자주 만들어낸다는 것을 발견했다. 한 사례에서, 백과사전은 파이스트의 아버지가 2021년에 사망했다는 Vice 기사를 인용했는데, 실제 기사는 2017년 것이었고 사망에 대한 언급이 없었으며 당시 그녀의 아버지는 여전히 살아있었다.​

위키피디아 공동 창립자 지미 웨일스는 이 프로젝트를 일축하며 CNBC에 대규모 언어 모델이 "대규모 오류"를 만들어낼 것이라고 말했다. "저는 그로키피디아를 철저히 검토할 기회가 없었고, 흥미롭게 생각하지만, 일론 머스크의 탁월함에 대한 찬사로 가득 차 있는 것 같습니다"라고 웨일스는 말했다.​


투명성 격차와 이념적 우려

공개 편집을 허용하고 변경 사항과 출처에 대한 상세한 기록을 유지하는 위키백과와 달리, 그로키피디아는 기사가 AI로 생성되었다는 점을 인정하는 것 외에는 기사 작성 방법에 대한 어떠한 통찰도 제공하지 않습니다. 사용자는 양식을 통해 피드백을 제출할 수는 있지만 항목을 직접 편집할 수는 없습니다.​

이 플랫폼은 논란의 여지가 있는 주제를 다루는 방식으로 특히 면밀한 조사를 받았습니다. 한 분석에 따르면, 그로키피디아의 1월 6일 국회의사당 공격에 대한 항목은 사건 자체보다 언론 보도에 대한 이의 제기에 더 초점을 맞추고 있습니다. 이 백과사전에는 또한 InfoWars를 인용하는 "클린턴 시체 수" 음모론을 홍보하는 기사도 포함되어 있습니다.​

코넬 공대 연구 결과에 대한 논평 요청을 받았을 때, xAI는 "레거시 미디어는 거짓말을 한다(Legacy Media Lies)"라는 자동 응답을 보냈습니다. 목요일, 머스크는 그로키피디아가 "충분히 좋아지면(아직 갈 길이 멀지만)" "은하 백과사전(Encyclopedia Galactica)"으로 브랜드를 변경할 계획이라고 발표했습니다.

댓글 0
전체 1,366 / 63 페이지
Anthropic은 Claude를 위한 세 가지 베타 기능인 Tool Search Tool, Programmatic Tool Calling, Tool Use Examples를 출시했습니다. 이는 AI 에이전트가 컨텍스트 윈도우를 과부하시키지 않고 수백 또는 수천 개의 도구를 사용할 수 있도록 하며, 개별 API 요청 대신 코드를 통해 도구를 호출하고, 스키마 정의만으로가 아닌 구체적인 예시를 통해 올바른 사용법을 학습하도록 설계되었습니다.내부 테스트에서 Tool Search Tool은 토큰 사용량을 85% 감소시키는 동시에 대규모 도구 라이브러리에서 Opus 4.5의 정확도를 79.5%에서 88.1%로 향상시켰으며, Programmatic Tool Calling은 복잡한 연구 작업에서 37%의 토큰 절감을 달성하면서 이전에 도구 호출당 수백 밀리초가 필요했던 여러 추론 과정을 제거했습니다.이 기능들은 GitHub, Slack, Sentry, Grafana, Splunk를 연결하는 기본 5개 서버 설정에서 대화가 시작되기 전에 약 55,000개의 토큰을 소비하는 중요한 확장성 문제를 해결합니다. Anthropic은 최적화 이전 프로덕션 환경에서 도구 정의가 최대 134,000개의 토큰을 소비하는 것을 관찰했습니다.
650 조회
0 추천
2025.11.25 등록
기술 저널리스트 Alex Kantrowitz와 Ranjan Roy는 Google의 Gemini 3가 OpenAI의 심각한 경쟁자로 부상했으며, Sam Altman이 유출된 메모에서 직원들에게 “거친 분위기”와 “일시적인 경제적 역풍”을 예상하라고 경고했다고 논의했습니다. Kantrowitz는 이를 분수령의 순간이라고 부르며, OpenAI가 앞서간다는 것을 인정받은 적이 없었다고 말했습니다.Gemini 3는 Arc AGI와 LM Arena 리더보드를 포함한 주요 AI 벤치마크에서 1위를 차지했으며, 추상적 시각 추론에서 GPT-5.1의 점수(31.1% 대 17.6%)의 거의 두 배를 달성했습니다. 한편 Google의 조직 재편—DeepMind와 Brain을 회사의 “엔진룸”으로 통합하고 검색에서 수백 명의 엔지니어를 이동—이 이러한 반전을 가능하게 했습니다.이러한 변화는 Google이 시가총액 3조 6,200억 달러로 Microsoft를 앞지르고, Nvidia의 기록적인 실적이 AI 거래를 유지하지 못하면서 발생했으며, 주가는 상승 5%에서 하락 3%로 반전되었습니다. 이는 AI 모델의 상품화와 경쟁하는 챗봇들이 기능적으로 상호 교환 가능해지고 있는지에 대한 투자자들의 우려가 커지면서 나타났습니다.
638 조회
0 추천
2025.11.25 등록
개발자 Simon Willison은 최상위 모델들이 현재 너무나 유사하게 작동하여 실제 작업에서는 기업들이 각 릴리스마다 개선을 주장함에도 불구하고 의미 있는 성능 차이를 드러내지 못하기 때문에, 최첨단 AI 모델 평가가 점점 더 어려워지고 있다고 주장한다.Willison은 Anthropic에서 새로 출시한 Claude Opus 4.5를 사용하여 이틀 동안 39개 파일에 걸쳐 2,022개의 코드 추가를 포함하는 광범위한 코딩 작업을 완료한 후, 이전 Claude Sonnet 4.5 모델로 다시 전환했을 때도 동일한 속도로 작업을 계속할 수 있었으며, 두 모델 간의 구체적인 성능 차이를 식별할 수 없었다고 밝혔다.Willison은 AI 연구소들이 새로운 모델을 출시할 때 이전 모델에서는 실패했지만 새 모델에서는 성공하는 프롬프트의 구체적인 예시를 함께 제공할 것을 요구하며, 이러한 시연이 MMLU나 GPQA Diamond와 같은 테스트에서 한 자릿수 백분율 포인트 개선을 보여주는 벤치마크보다 더 가치 있을 것이라고 주장한다—이는 최첨단 모델들이 전통적인 평가 지표를 점점 더 포화시키면서 업계 전반이 겪고 있는 어려움을 반영하는 과제이다.
685 조회
0 추천
2025.11.25 등록
VentureBeat기사는스스로를"AI우선"이라고선언하는대부분의기업들이진정한도입보다는형식적인혁신에몰두하고있다고주장하며,진정한AI도입은하향식기업지시가아닌호기심많은직원들이조용히실험하는과정에서자연스럽게나타난다고설명합니다.​이기사는직접프로토타입을만들고자신의실패를공유하는리더와금요일까지AI계획을요구하는Slack메시지로단순히규정준수를강요하는리더를구분하며,전자는실질적인추진력을조성하는반면후자는반감을낳는다고설명합니다.​기사는재무및운영부서의직원들이일반적으로이사회프레젠테이션에등장하는고가의엔터프라이즈플랫폼이아닌"그냥ChatGPT"를사용한다고인정한다고언급하며,최근설문조사에따르면광범위한도입의무에도불구하고직원의5%만이AI를최대한활용하여업무를혁신하고있다고밝힙니다.
668 조회
0 추천
2025.11.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입