AI 뉴스

머스크의 그로키피디아는 수천 개의 신뢰할 수 없는 출처를 인용합니다

페이지 정보

작성자 xtalfi
작성일 2025.11.15 14:44
968 조회
0 추천
0 비추천

본문

2243669565_zxyqoe.jpg

(퍼플렉시티가 정리한 기사)


일론 머스크의 AI 기반 백과사전 Grokipedia가 전문가들이 신뢰할 수 없다고 판단한 수천 개의 출처를 인용하고 있어, 정보 출처로서의 플랫폼 신뢰성에 대한 우려가 제기되고 있다고 코넬 테크 연구진이 금요일 발표한 연구 결과가 밝혔다.

arXiv에 게재된 종합 분석에 따르면, Grokipedia는 위키백과 편집자들이 "일반적으로 신뢰할 수 없음", "블랙리스트" 또는 "사용 중단"으로 분류한 출처에 대한 260만 개의 인용을 포함하고 있으며, 이는 전체 인용의 6%를 차지하여 위키백과에서 발견되는 비율의 두 배에 달한다. 이 연구는 코넬 테크의 개인정보 보호 및 보안 연구원인 Harold Triedman과 대학의 보안, 신뢰 및 안전 이니셔티브 책임자인 Alexios Mantzarlis가 수행했다.​


주변부 사이트가 광범위하게 인용됨

가장 우려스러운 발견 중 하나는 연구자들이 위키피디아가 결코 참조하지 않는 웹사이트에 대한 180개의 인용을 발견했다는 것입니다. 여기에는 백인 민족주의 포럼인 Stormfront에 대한 42개의 인용, 음모론 웹사이트 InfoWars에 대한 34개의 인용, 그리고 백신 반대 사이트 Natural News에 대한 수십 개 이상의 인용이 포함되어 있습니다. "그로키피디아는 이러한 출처들의 신뢰성을 검증하지 않고 인용하고 있습니다"라고 연구자들은 지적했습니다.​

연구에 따르면 "일반적으로 신뢰할 수 없는" 것으로 간주되는 출처가 그로키피디아 인용의 5.4%를 차지하는데, 이는 위키피디아와 비교하여 86% 상대적 증가를 나타내며, "블랙리스트에 등재된" 출처는 인용의 0.1%를 차지하여 275%의 상대적 증가를 나타냅니다. 반대로, "일반적으로 신뢰할 수 있는" 출처는 인용의 7.7%만을 차지하여 위키피디아보다 39% 감소했습니다.​

연구자들은 플랫폼의 10월 27일 출시 며칠 후인 10월 28일부터 30일 사이에 그로키피디아 말뭉치의 99.8%인 883,858개의 기사를 스크래핑했습니다. 이 데이터는 추가 분석을 위해 GitHub와 Hugging Face에 공개적으로 공개되었습니다.​


플랫폼이 비판을 받다

머스크의 xAI 회사가 출시한 Grokipedia는 머스크가 "선전물"이라고 반복적으로 비판해온 위키백과에 대한 덜 편향된 대안으로 자리매김하고 있습니다. 그러나 위키미디어 재단은 "Grokipedia조차도 위키백과가 존재해야 한다"고 강조하며, AI 백과사전 콘텐츠의 상당 부분이 위키백과 문서에서 파생된 것으로 보인다고 지적했습니다.​

논평을 요청받은 xAI는 "레거시 미디어는 거짓말을 한다"라는 자동 메시지로 응답했습니다.

댓글 0
전체 1,366 / 58 페이지
글로벌여행기술그룹Travelsoft는11월25일AISearchforTourism을공개했습니다.이는여행회사들이전통적인검색엔진트래픽에서AI기반발견및예약으로의전환을헤쳐나갈수있도록설계된포괄적인인공지능플랫폼입니다.이모듈형플랫폼은관광산업이직면한긴급한과제를해결합니다.SearchGenerativeExperience(SGE)와AI기반도구가여행관련질문에직접답변하면서,기업들은기존검색엔진에서유입되는웹사이트트래픽이급격히감소하는것을목격하고있습니다.이솔루션은콘텐츠최적화,AI에이전트,기술인프라를결합하여운영효율성을유지하면서생성형AI플랫폼을통해여행상품을발견할수있도록합니다.​실시간콘텐츠엔진으로기업시간절약플랫폼의핵심에는AI기반프로세스와함께인간의검증을통해관광콘텐츠를표준화하고풍성하게만드는콘텐츠엔진이있습니다.이는생성엔진최적화(GEO)와답변엔진최적화(AEO)를통해구현됩니다.시스템은호텔목록,상품페이지,여행지설명을동적으로업데이트하여콘텐츠가전통적인검색엔진과AI플랫폼모두에서의미적으로최적화된상태로유지되도록합니다.​이플랫폼을사용하는여행사들은편집생산시간에서최대85%까지절약했다고Travelsoft는전했습니다.이러한효율성향상덕분에기업들은번거로운콘텐츠업데이트대신맞춤형서비스에집중할수있고,더욱관련성높은콘텐츠를통해전환율또한높아지고있습니다.​“AI는여행자들이여행을검색하고,예약하고,경험하는방식을재정의하고있습니다.”라고Travelsoft의창립자이자CEO인ChristianSabbagh는말했습니다.“업계는대규모로AI를도입할수있는구조적이고신뢰할수있는방식을필요로합니다.TravelsoftAISearchfortourism을통해여행사는원시데이터를실질적인가치로변환할수있습니다.우리의목표는간단합니다.모든여행비즈니스가호기심에서구체적인영향으로나아가도록돕는것입니다.”​다국어플랫폼이모든규모의기업에적응합니다네이티브다국어솔루션으로설계된AISearchforTourism은대기업부터소규모스타트업까지전세계여행회사를지원합니다.이플랫폼은호텔체인,여행사,관광지마케팅조직과같은비상거래제공업체를포함한모든여행산업참여자에게적용가능합니다.​이번출시는여행업계가변화하는소비자행동에적응해야한다는압박이커지는가운데이루어졌으며,업계조사에따르면전체여행객의절반이향후1년내에여가여행계획을위해생성형AI도구를사용할것으로예상하고있습니다.2000년파리에서설립된Travelsoft는연간약350억유로규모의여행예약을처리하며80개이상의국가에서운영되고있습니다.
601 조회
0 추천
2025.11.27 등록
자율주행로봇전문기업로보티즈가편의점CU의물류를담당하는BGF로지스와협력하여물류센터에휴머노이드로봇을투입합니다.로보티즈는산업통상자원부가지원하는60억원규모의산업기술혁신사업주관기관으로선정되었으며,이를통해'AI파운데이션모델기반유통공정특화휴머노이드로봇'을개발하고실증할예정입니다.이번프로젝트에는로보티즈외에도고려대학교,광운대학교,한국통합물류협회,BGF로지스등이민간및학계파트너로참여하여유통물류센터에서실제활용가능한로봇기술을고도화할계획입니다.개발될로봇의핵심은최근AI업계의주요트렌드인비전-언어-행동(VLA)모델과피지컬AI기술이적용된다는점입니다.이를통해로봇은시각과언어정보를스스로이해하고판단하여행동할수있게되며,기존자동화설비로는처리가어려웠던분류,피킹,반품등비정형상품의수작업공정을수행할수있을것으로기대됩니다.로보티즈는가상의실험실이아닌실제BGF로지스의물류현장에로봇을투입하여입출고및오발주처리등고난도작업을수행하게할방침입니다.이를통해핵심공정자동화율을80%이상으로높이고,오발주재분류및피킹작업의성공률을90%이상달성하여물류현장의인력부족문제를근본적으로해결하는것을목표로하고있습니다.로보티즈김병수대표는이번협력을통해로봇이인간의작업을대체하고협업하는수준까지기술을발전시켜글로벌물류자동화시장에서경쟁력을확보하겠다는포부를밝혔습니다.
633 조회
0 추천
2025.11.26 등록
MIT 연구진은 대규모 언어 모델의 신뢰성을 훼손할 수 있는 취약점을 발견했으며, GPT-4 및 Llama와 같은 고급 AI 시스템조차도 때때로 진정한 이해보다는 문법적 지름길을 기반으로 질문에 답한다는 사실을 밝혔습니다.신경 정보 처리 시스템 학회(Conference on Neural Information Processing Systems)에서 발표될 예정인 이 연구는 LLM이 특정 문장 패턴을 특정 주제와 잘못 연관시킨 다음, 실제 질문을 이해하는 대신 이러한 학습된 패턴에 의존할 수 있다는 것을 발견했습니다. 이러한 결함은 정확한 응답이 중요한 의료, 금융 및 고객 서비스 분야에 배포된 AI 시스템에 위험을 초래합니다.의미보다 문법MIT 부교수 Marzyeh Ghassemi가 이끄는 연구팀은 Northeastern University와 Meta의 연구원들과 함께, 모델이 훈련 중에 “구문 템플릿”—품사의 패턴—을 특정 도메인과 연결하는 방법을 학습하는 과정을 입증했다.MIT News 기사에 따르면, LLM은 “파리는 어디에 위치해 있나요?“가 지리 질문과 관련된 특정 문법 구조를 따른다는 것을 학습할 수 있다. 문법적으로는 유사하지만 “빠르게 앉다 파리 흐림?“과 같이 말이 되지 않는 질문이 제시될 때, 모델은 질문이 무의미함에도 불구하고 여전히 “프랑스”라고 답할 수 있다.Northeastern University 대학원생이자 MIT 방문 학생인 Chantal Shaib는 “이것은 모델이 질문에 올바르게 답하기 위해 학습하는 간과된 유형의 연관성입니다”라고 말했다. 연구원들은 구문을 동일하게 유지하면서 단어를 동의어, 반의어 또는 무작위 단어로 대체했을 때, LLM이 질문이 완전히 말도 안 되는 경우에도 종종 올바른 답변을 생성한다는 것을 발견했다.보안 및 테스트 시사점이 취약점은 심각한 보안상의 영향을 미칩니다. arXiv에 게시된 연구에 따르면, 공격자들은 모델이 무해한 콘텐츠와 연관시키는 구문 패턴을 사용하여 유해한 요청을 표현함으로써 안전 가드레일을 우회하기 위해 이 현상을 악용할 수 있습니다.연구에 참여한 MIT 대학원생 Vinith Suriyakumar는 “이 연구를 통해 LLM의 보안 취약점을 해결하기 위해 더욱 강력한 방어 체계가 필요하다는 것이 분명해졌습니다”라고 말했습니다. 연구진은 GPT-4와 Llama를 포함한 사전 훈련된 모델에서 이를 테스트했으며, 학습된 행동이 성능을 크게 저하시킨다는 것을 발견했습니다.문제를 해결하기 위해 연구팀은 개발자들이 자신의 모델이 이러한 잘못된 구문-도메인 상관관계에 의존하는지 평가할 수 있는 자동 벤치마킹 절차를 개발했습니다. 연구진은 더 다양한 구문 템플릿을 포함한 증강된 훈련 데이터를 활용한 완화 전략을 탐구할 계획이며, 복잡한 다단계 작업을 위해 설계된 추론 모델에서 이 현상을 연구할 예정입니다.
621 조회
0 추천
2025.11.26 등록
메타 플랫폼스가 구글의 AI 칩 텐서처리장치(TPU)를 2027년부터 데이터센터에 도입하는 방안을 논의 중인 것으로 25일 알려지면서, 엔비디아가 장악해온 AI 반도체 시장에 균열이 생길 조짐을 보이고 있다. 이날 뉴욕증시에서 엔비디아 주가는 2.59% 하락한 177.82달러에 마감한 반면, 알파벳 주가는 1.62% 상승하며 시가총액 4조 달러를 눈앞에 두게 됐다.IT 전문매체 디 인포메이션은 24일 메타가 수십억 달러 규모로 구글의 TPU를 도입하는 방안을 검토 중이라고 보도했다. 메타는 2027년부터 자사 데이터센터에 TPU를 직접 설치하고, 내년에는 구글 클라우드를 통해 TPU를 임대하는 방안도 협의하고 있는 것으로 전해졌다. 현재 메타는 AI 학습과 서비스 운영에 엔비디아 GPU를 대규모로 사용하고 있어, 이 계약이 성사되면 엔비디아의 주요 고객사에 대한 영향력이 축소될 수 있다는 우려가 나온다.구글 제미나이3.0 성공이 TPU 확산 계기구글이 자체 AI 칩에 자신감을 갖게 된 배경에는 최근 공개한 AI 모델 ‘제미나이 3.0 프로’의 성공이 있다. 제미나이 3.0 프로는 LM아레나 리더보드에서 1501점을 기록하며 처음으로 1500점을 돌파했고, ‘인류의 마지막 시험’에서 정답률 37.5%로 챗GPT의 26.5%를 크게 앞섰다. 이 모델은 엔비디아 GPU 없이 100% 자체 TPU 클러스터만으로 학습됐다는 점에서 업계의 주목을 받고 있다.구글은 지난 10월 AI 챗봇 ‘클로드’를 운영하는 앤트로픽과 최대 100만 개의 TPU를 공급하는 수백억 달러 규모의 계약을 체결한 바 있다. 구글 클라우드 경영진은 TPU 도입 확대를 통해 엔비디아 연간 매출의 최대 10%를 확보할 수 있을 것으로 보고 있다고 디 인포메이션은 전했다.엔비디아 즉각 반박, 삼성전자는 수혜 전망엔비디아는 25일 소셜미디어 엑스(X)를 통해 “우리는 업계보다 한 세대 앞서 있으며, 모든 AI 모델을 구동하고 컴퓨팅이 이뤄지는 모든 곳에서 이를 수행하는 것은 우리 플랫폼뿐”이라고 강조했다. 엔비디아는 “TPU 같은 주문형반도체(ASIC)보다 뛰어난 성능과 다용성, 호환성을 제공한다”고 덧붙였다.구글도 성명에서 “맞춤형 TPU와 엔비디아 GPU 모두 수요가 늘어나고 있다”며 “우리는 수년간 그래왔던 대로 양쪽 모두를 지원할 것”이라고 밝혔다.증권가에서는 TPU 생태계 확장의 최대 수혜자로 삼성전자를 꼽고 있다. 김동원 KB증권 연구원은 “구글 TPU 설계와 생산을 담당하는 브로드컴의 경우 삼성전자가 메모리 공급 점유율 1위를 기록하고 있어 향후 구글 TPU 생태계 확장의 최대 수혜가 기대된다”고 분석했다. SK하이닉스도 구글 TPU에 HBM을 공급하고 있어 AI 생태계 다변화로 수혜를 볼 것으로 전망된다.
668 조회
0 추천
2025.11.26 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입