AI 뉴스

스탠포드 연구 결과, AI 챗봇이 사실과 믿음을 구별하는 데 어려움

페이지 정보

작성자 xtalfi
작성일 2025.11.05 16:56
1,374 조회
0 추천
0 비추천

본문

solen-feyissa-5Ib2B9MBJhQ-unsplash.jpg

(퍼플렉시티가 정리한 기사)


Nature Machine Intelligence에 발표된 포괄적인 연구에 따르면, ChatGPT를 포함한 주요 AI 챗봇들이 참된 믿음과 거짓된 믿음을 안정적으로 구분하지 못하는 것으로 밝혀졌으며, 이는 의료, 법률, 저널리즘과 같은 중요한 분야에서의 배치에 대한 심각한 우려를 제기하고 있다.​


AI 모델들, 신념 인식에서 근본적인 약점 보여

스탠퍼드 대학교 연구진은 13,000개의 질문을 사용하여 24개의 대규모 언어 모델을 테스트한 결과, 모든 시스템이 참인 믿음에 비해 거짓 믿음을 식별하는 데 어려움을 겪는 것으로 나타났다. 연구에 따르면 GPT-4o를 포함하여 2024년 5월 이후에 출시된 최신 모델들은 참인 1인칭 믿음에 비해 거짓 1인칭 믿음을 인정할 가능성이 34.3% 낮았다. 구형 모델들은 더욱 낮은 성능을 보여 거짓 믿음을 정확하게 식별하는 비율이 38.6% 감소했다.​

이러한 모델들은 단순한 참 또는 거짓 진술을 식별할 때 91.1%에서 91.5% 사이의 정확도를 달성했지만, "나는 ...라고 믿는다"와 같은 믿음 기반 언어를 다룰 때는 성능이 급격히 저하되었다. 연구진에 따르면, AI 시스템은 "일관성 없는 추론 전략"을 보였으며, 깊이 있는 이해보다는 피상적인 패턴 매칭에 의존했다.​


실제 응용 분야에 대한 우려 증가

이번 연구 결과는 AI 챗봇 사용이 급속도로 확대되고 있는 중요한 시점에 나왔다. 최근 Adobe Express 보고서에 따르면 ChatGPT를 사용하는 미국인의 77%가 이를 검색 엔진으로 간주하며, 사용자 3명 중 1명은 기존 검색 엔진보다 더 신뢰한다고 밝혔다. 이러한 추세는 규제 조치를 촉발했으며, OpenAI는 2025년 10월 29일부로 ChatGPT가 의료, 법률 또는 금융 조언을 제공하는 것을 공식적으로 금지했다.​

마드리드 자치대학교의 컴퓨터 언어학 전문가인 Pablo Haya Coll은 정확성이 필수적인 중요한 분야에서 "믿음과 지식을 혼동하면 판단에 심각한 오류를 초래할 수 있다"고 경고했다. 연구진은 이러한 한계가 "진단을 오도하고, 사법적 판단을 왜곡하며, 잘못된 정보를 증폭시킬 수 있다"고 강조했다.​

최근 사건들은 실제로 이러한 위험을 부각시켰다. 5월에 캘리포니아 판사는 법률 문서에 AI가 생성한 허위 정보를 포함시킨 두 로펌에 31,000달러의 벌금을 부과했다. 또한 스탠퍼드 대학의 허위정보 전문가는 ChatGPT의 도움으로 작성된 법정 진술서에서 "환각적 인용"을 간과했음을 인정했다.​

연구 저자들은 AI 기술이 고위험 분야에 광범위하게 배포되기 전에 "긴급한 개선"이 필요하다고 결론지었으며, 특히 주관적 믿음과 객관적 사실을 구분하지 못하는 기술의 무능력은 근본적인 구조적 약점을 나타낸다고 밝혔다.

댓글 0
전체 1,366 / 88 페이지
Google DeepMind는 Boston Dynamics의 전 최고기술책임자(CTO)인 Aaron Saunders를 하드웨어 엔지니어링 부사장으로 영입했습니다. 이는 CEO Demis Hassabis가 Gemini를 Android가 여러 제조업체의 스마트폰을 구동하는 것처럼 범용 로봇 운영체제로 변모시키려는 비전을 발전시키기 위한 것입니다.Hassabis는 Gemini가 “거의 모든 물리적 구성으로 즉시 작동할 수 있는” AI 기반으로 기능하기를 목표로 하며, 이는 인간형 및 비인간형 로봇을 포함하여 회사가 AI 기반 로봇공학 분야로의 진출을 강화하고 있는 가운데 추진되고 있습니다.이러한 움직임은 Google DeepMind를 2035년까지 510억 달러 규모에 달할 것으로 예상되는 급속히 성장하는 시장에서 경쟁할 수 있는 위치에 올려놓습니다. 경쟁사인 Tesla는 향후 10년간 백만 대의 Optimus 인간형 로봇 생산을 목표로 하고 있으며, Unitree와 같은 중국 기업들은 경쟁력 있는 가격의 다리 달린 로봇을 제공하고 있습니다
883 조회
0 추천
2025.11.20 등록
MIT 연구원들은 새로운 추론 AI 모델에서 가장 많은 연산 처리를 요구하는 문제 유형이 인간이 해결하는 데 가장 오래 걸리는 문제와 동일하다는 것을 발견했으며, 이는 인공지능과 생물학적 지능이 복잡한 사고에 접근하는 방식에서 예상치 못한 수렴을 시사합니다PNAS에 게재된 이 연구는 7가지 문제 유형에 걸쳐 인간의 반응 시간과 AI가 생성한 “토큰”(내부 연산 단계)을 측정했으며, 놀라운 상관관계를 발견했습니다—인간과 모델 모두 “ARC 챌린지“라고 불리는 시각적 추론 과제에 가장 오래 걸리고 기본 산술에는 가장 적은 노력을 소비했습니다추론 모델은 훈련 중 강화 학습을 통해 향상된 성능을 달성하는데, 정답에 대해서는 보상을 받고 오류에 대해서는 페널티를 받아 문제 공간을 탐색하고 인간의 문제 해결 접근 방식을 반영하는 단계별 솔루션 전략을 개발할 수 있습니다
909 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)러시아대통령블라디미르푸틴이수요일모스크바에서열린AI저니컨퍼런스에서춤추는휴머노이드로봇의환영을받았다.푸틴은이자리에서러시아가국내전문가들이완전히통제할수있는독자적인인공지능기술을개발해야한다고강조하며,AI주권이국가안보에필수적임을밝혔다.러시아스베르은행이주최한제10회연례컨퍼런스에서푸틴은"러시아는생성형인공지능분야에서독자적인기술과제품을완비해야한다."고선언했다.그는외국의AI시스템에의존하는것이국가의기술적·문화적자율성에위험을초래할수있다고경고했다.11월19일부터21일까지스베르은행본사에서진행된이번컨퍼런스에서는러시아의최신AI성과시연이펼쳐졌으며,그중에는푸틴이도착했을때맞이한스베르은행의GigaChat언어모형으로구동되는인간형로봇도있었다.​AI야망을위한원자력에너지푸틴은향후20년동안우랄,시베리아,극동지역을중심으로38기의새로운원자력발전소건설계획을발표했으며,이들의총발전용량은러시아의현재원전발전량과거의맞먹는수준이다.대통령은데이터센터의전력소비가이번10년동안3배이상증가할것으로예상됨에따라에너지인프라가매우중요하다고강조했다.​“가장중요하고근본적인과제는데이터센터에대규모의에너지를지속적이고안정적이며신뢰성있게공급하는일입니다.”라고푸틴은말했다.그는AI인프라에전력을공급할수있는소형모듈형원자로개발에서러시아의역량을언급했다.​국가인공지능태스크포스와경제목표푸틴대통령은생성적인공지능개발을감독할국가태스크포스의창설을명령하고,정부에포괄적인이행계획을수립할것을지시했다.그는AI기술이2030년까지러시아국내총생산(GDP)에11조루블(1,360억달러)이상을기여해야한다고전망했다.​대통령은언어모델이세계관에영향을미치고"전체국가의의미공간"을형성할수있는도구가되었다고강조하며,이른바"가치기반주권"을유지하기위해서는자체적인개발이필수적이라고밝혔다.​서양기술과의경쟁러시아의인공지능(AI)부문은미국과중국에뒤처져있으며,토터스미디어의글로벌AI지수에따르면전세계31위를차지하고있다.서방의마이크로칩수입제한제재는모스크바의컴퓨팅야심에차질을빚었으나,러시아는주요국산언어모델두개를개발했다:스베르방크의GigaChat과얀덱스의YandexGPT이다.​푸틴대통령과함께전시회를둘러본스베르방크의CEO게르만그레프는은행이매년약10억달러를AI개발에투자한다고밝혔다.이번컨퍼런스에서는의약품개발부터건강모니터링ATM에이르기까지다양한응용사례가선보였다.​푸틴대통령은AI규제가필요하다고강조하면서도,국가안보와정보작전을위해서는러시아가자체개발한모델만을사용해야하며,이를통해데이터가국경내에안전하게보관된다는점을분명히했다.
879 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)엔비디아가19일(현지시간)3분기매출570억1000만달러(약83조4000억원)를기록하며시장예상치를크게웃돌았다.이번실적발표로AI거품론논란이일단락되며뉴욕증시는5거래일만에반등에성공했다.​엔비디아의주당순이익(EPS)은1.30달러로시장전망치1.25달러를상회했으며,매출역시예상치549억2000만달러를넘어섰다.시간외거래에서엔비디아주가는5%이상급등했고,나스닥선물은1.20%상승했다.이날정규장에서S&P500지수는0.38%,나스닥종합지수는0.59%상승마감했다.​데이터센터부문90%차지…블랙웰"품절"데이터센터부문매출은전년대비66%증가한512억달러를기록하며전체매출의90%에육박했다.젠슨황최고경영자(CEO)는"블랙웰판매량은차트에표시할수없을정도로높고,클라우드GPU는품절상태"라며"우리는AI의선순환구조에진입했다"고밝혔다.​황CEO는"AI생태계는급속히확장중이며더많은새모델개발사,더많은AI스타트업이다양한산업과국가에서등장하고있다"고강조했다.엔비디아는4분기(11월∼내년1월)매출전망을650억달러로제시해시장예상치616억6000만달러를상회했다.​한국반도체업계동반상승엔비디아의호실적영향으로SK하이닉스는20일프리마켓에서전일대비6.58%급등한59만9000원을기록했다.삼성전자도3.52%오른9만9000원에거래됐다.​한편12월금리인하기대감이후퇴하며시카고상품거래소(CME)페드워치에따르면12월연방공개시장위원회(FOMC)에서0.25%포인트금리인하확률은31.6%까지떨어졌다.도널드트럼프대통령은이날미-사우디아라비아투자행사에서제롬파월의장을겨냥해금리인하를압박했다.
932 조회
0 추천
2025.11.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입