AI 뉴스

스탠포드 연구 결과, AI 챗봇이 사실과 믿음을 구별하는 데 어려움

페이지 정보

작성자 xtalfi
작성일 11.05 16:56
141 조회
0 추천
0 비추천

본문

solen-feyissa-5Ib2B9MBJhQ-unsplash.jpg

(퍼플렉시티가 정리한 기사)


Nature Machine Intelligence에 발표된 포괄적인 연구에 따르면, ChatGPT를 포함한 주요 AI 챗봇들이 참된 믿음과 거짓된 믿음을 안정적으로 구분하지 못하는 것으로 밝혀졌으며, 이는 의료, 법률, 저널리즘과 같은 중요한 분야에서의 배치에 대한 심각한 우려를 제기하고 있다.​


AI 모델들, 신념 인식에서 근본적인 약점 보여

스탠퍼드 대학교 연구진은 13,000개의 질문을 사용하여 24개의 대규모 언어 모델을 테스트한 결과, 모든 시스템이 참인 믿음에 비해 거짓 믿음을 식별하는 데 어려움을 겪는 것으로 나타났다. 연구에 따르면 GPT-4o를 포함하여 2024년 5월 이후에 출시된 최신 모델들은 참인 1인칭 믿음에 비해 거짓 1인칭 믿음을 인정할 가능성이 34.3% 낮았다. 구형 모델들은 더욱 낮은 성능을 보여 거짓 믿음을 정확하게 식별하는 비율이 38.6% 감소했다.​

이러한 모델들은 단순한 참 또는 거짓 진술을 식별할 때 91.1%에서 91.5% 사이의 정확도를 달성했지만, "나는 ...라고 믿는다"와 같은 믿음 기반 언어를 다룰 때는 성능이 급격히 저하되었다. 연구진에 따르면, AI 시스템은 "일관성 없는 추론 전략"을 보였으며, 깊이 있는 이해보다는 피상적인 패턴 매칭에 의존했다.​


실제 응용 분야에 대한 우려 증가

이번 연구 결과는 AI 챗봇 사용이 급속도로 확대되고 있는 중요한 시점에 나왔다. 최근 Adobe Express 보고서에 따르면 ChatGPT를 사용하는 미국인의 77%가 이를 검색 엔진으로 간주하며, 사용자 3명 중 1명은 기존 검색 엔진보다 더 신뢰한다고 밝혔다. 이러한 추세는 규제 조치를 촉발했으며, OpenAI는 2025년 10월 29일부로 ChatGPT가 의료, 법률 또는 금융 조언을 제공하는 것을 공식적으로 금지했다.​

마드리드 자치대학교의 컴퓨터 언어학 전문가인 Pablo Haya Coll은 정확성이 필수적인 중요한 분야에서 "믿음과 지식을 혼동하면 판단에 심각한 오류를 초래할 수 있다"고 경고했다. 연구진은 이러한 한계가 "진단을 오도하고, 사법적 판단을 왜곡하며, 잘못된 정보를 증폭시킬 수 있다"고 강조했다.​

최근 사건들은 실제로 이러한 위험을 부각시켰다. 5월에 캘리포니아 판사는 법률 문서에 AI가 생성한 허위 정보를 포함시킨 두 로펌에 31,000달러의 벌금을 부과했다. 또한 스탠퍼드 대학의 허위정보 전문가는 ChatGPT의 도움으로 작성된 법정 진술서에서 "환각적 인용"을 간과했음을 인정했다.​

연구 저자들은 AI 기술이 고위험 분야에 광범위하게 배포되기 전에 "긴급한 개선"이 필요하다고 결론지었으며, 특히 주관적 믿음과 객관적 사실을 구분하지 못하는 기술의 무능력은 근본적인 구조적 약점을 나타낸다고 밝혔다.

댓글 0
전체 888 / 36 페이지
(퍼플렉시티가정리한기사)트럼프대통령의암호화폐및AI차르인데이비드색스는월요일인공지능이"오웰리안"적수준의정부감시를가능하게한다는강력한경고를발표했으며,AI로부터의진정한위협은기계가인간에게등을돌리는것이아니라국가의정보통제와시민감시라고주장했다.앤드리슨호로위츠의팟캐스트"TheBen&MarcShow"에서색스는가장큰위험은"당신에게거짓말을하고,답변을왜곡하며,권력을가진사람들의현재정치적의제에봉사하기위해실시간으로역사를다시쓸수있는"AI시스템에있다고강조했다.그는AI가잠재적으로"정부가당신을감시하고통제하는완벽한도구"가될수있다고설명했다.​AI규제철학을둘러싼충돌Sacks의발언은AI기업Anthropic과의진행중인공개논쟁을격화시켰으며,그는Anthropic이"공포조장에기반한정교한규제포획전략을운영하고있다"고비난했다.이논쟁은AI거버넌스에대한근본적으로다른접근방식을중심으로하며,Sacks는포괄적인개발자규제보다는AI오용을표적으로삼을것을주장하고있다.​"우리가실제로이야기하고있는것은오웰적AI입니다"라고Sacks는말하며,할리우드가묘사하는AI위협과자신의우려를구분했다."터미네이터가아니라1984입니다"라고그는조지오웰의디스토피아적감시국가를언급하며말했다.​AnthropicCEODarioAmodei가Sacks의주장에대해"부정확하다"고반박하며자신의회사가상충되는주규제를피하기위해일관되게연방감독을옹호해왔다고주장하면서갈등이심화되었다.Amodei는Anthropic의"공익헌장이사회의더큰선을위해AI를사용할것을약속한다"고강조했다.​기술산업분열이나타나다이논쟁은실리콘밸리AI커뮤니티내에서더깊은정치적분열을드러냈다.링크드인공동창업자리드호프만은앤트로픽을"착한쪽"이라고옹호했으며,이에대해색스는호프만을"트럼프대통령을상대로한법적전쟁과비열한술수의주요자금제공자"라고강하게비난했다.경쟁AI업체xAI를운영하는일론머스크도"그렇다(Indeed)"는짧은코멘트로색스의입장에동의했다.​색스는특히바이든행정부의정책과캘리포니아및콜로라도와같은민주당주도의주들이"알고리즘차별"을다루기위해시행한"과도한"AI소비자보호법률을비판했다.그는과도한규제가AI를정부의편향을반영하는정치적도구로변질시켜불편한진실을억압할수있다고경고했다.​색스에따르면트럼프행정부의접근방식은AI분야의혁신을촉진하고암호화폐시장에규제적확실성을제공하는데중점을두고있다.이는이전행정부가AI안전과피해방지에중점을뒀던것과는큰전환점이다.
127 조회
0 추천
11.05 등록
(퍼플렉시티가정리한기사)Shopify는월요일3분기실적발표에서AI기반커머스의극적인성장을발표했으며,AI도구로부터의트래픽이1월이후7배증가했고AI기반검색을통한주문이같은기간동안11배증가했다고밝혔습니다.이전자상거래대기업은전년대비32%증가한28억4천만달러의매출을기록하면서이러한수치를보고했지만,영업이익기대치를소폭하회하여주가는장전거래에서3%하락했습니다.​AI파트너십이새로운커머스채널을주도하다HarleyFinkelstein사장은실적발표에서인공지능을"인터넷이후기술의가장큰변화"로규정하며,ChatGPT,Perplexity,MicrosoftCopilot과의통합을회사가"에이전틱커머스(agenticcommerce)"라고부르는것의핵심동력으로강조했습니다.이새로운모델은AI에이전트가대화형인터페이스내에서구매자를대신하여검색하고,비교하고,구매를촉진할수있게합니다.​회사의9월OpenAI와의파트너십을통해미국ChatGPT사용자들은채팅대화내에서Etsy판매자로부터직접구매할수있게되었으며,곧백만명이상의Shopify판매자들도유사한접근권한을얻을예정입니다.Finkelstein은"우리는모든AI대화에쇼핑을도입하는것을정말쉽게만들기위해이인프라를구축하고투자해왔습니다"라고말했습니다.최근Shopify설문조사에따르면소비자의64%가홀리데이쇼핑중어떤형태로든AI를사용할것으로예상하고있습니다.​내부AI도구가가능성을보이다외부파트너십외에도,Shopify의내부AI어시스턴트Sidekick은출시이후거의1억건의판매자상호작용을생성했으며,10월에만800만건을기록했습니다.3분기동안75만명이상의판매자가이도구를처음사용했습니다.또한회사는직원들이판매자피드백과지원티켓을분석하여제품개발결정을가속화하는데도움을주는AI도구인Scout를배포하고있습니다.​AI급증은Shopify의총상품거래액이전년대비32%증가한920억달러를기록하는가운데나타났으며,회사는4분기에20%중후반대의매출성장을전망하고있습니다.강력한펀더멘털에도불구하고,분석가들은AI개발투자와마케팅지출증가로인해영업비용이25.5%증가했다고지적했습니다.
128 조회
0 추천
11.05 등록
(퍼플렉시티가정리한기사)NvidiaCEO젠슨황이오늘영국기술부장관리즈켄달과만났으며,이는영국정부가글로벌AI리더로자리매김하고자하는가운데회사와영국간의확대되는파트너십에서중요한단계를나타냅니다.이번회동은황이케임브리지유니언소사이어티에서연설하고퀸엘리자베스공학상을수상하기위해영국을방문한가운데이루어졌습니다.논의는AI인프라개발과기술협력,특히정부의AI성장지역이니셔티브를중심으로진행되었습니다.​영국AI야심에대한전략적투자이번회담은Nvidia의최근영국시장에대한상당한투자약속을기반으로합니다.9월에이회사는영국의AI스타트업생태계를특별히목표로하는20억파운드의투자를발표했으며,Accel,AirStreetCapital,Balderton을포함한벤처캐피털기업들과협력하여혁신을가속화하고있습니다.이는2026년말까지최대120,000개의첨단GPU를배치하겠다는초기110억파운드약속에이어진것입니다.​Huang은올해초SkyNews와의인터뷰에서"영국은새로운산업혁명의정점에있었다"고말하며,영국을"인공지능의기원의본고장"이라고설명했습니다.​이러한투자는영국에서진행되는미국기술기업들의광범위한투자흐름의일부이며,기업들은AI인프라확장에400억달러이상을투자하고있습니다.Microsoft는2028년까지300억달러를약속했으며,Google은50억파운드의투자를발표했습니다.​AI성장지역이지역발전을주도하다논의의중심은지정된지역에서AI인프라배치를가속화하기위해고안된영국의AI성장구역전략이었습니다.정부는옥스퍼드셔의컬햄과북동부에구역을설정했으며,블라이스와코발트파크부지는5,000개이상의일자리를창출하고최대300억파운드의투자를유치할것으로예상됩니다.​북동부구역은OpenAI및영국기업Nscale과협력하여"스타게이트UK"프로젝트를진행하며,수천개의GPU를배치하여주권적AI인프라를구축합니다.블랙스톤은이미블라이스부지에100억파운드를투자하기로약속했으며,향후파트너로부터추가로200억파운드를투자받을가능성이있습니다.​켄달은이러한투자를긴축재정상황속에서경제성장에필수적인것으로자리매김했습니다."과학,기술및혁신을최우선으로하지않고는평균이상의성장을이룰수있는길이없습니다"라고그녀는말하며,지난주기록적인550억파운드규모의R&D자금패키지를발표했습니다.​그러나특히정부가AI구현을통해450억파운드의공무원비용절감을목표로하면서,AI가고용에미치는영향에대한우려가지속되고있습니다.업계관계자들은영국의AI초강대국야망을저해할수있는"극도로제한적인"에너지가격에대한정부의조치를요구해왔습니다.
127 조회
0 추천
11.05 등록
(퍼플렉시티가정리한기사)아마존은오늘고급AI어시스턴트AlexaPlus를iOS및Android기기의AmazonMusic앱에출시했으며,이는대화형인공지능을주류소비자경험에통합하려는회사의가장대담한시도입니다.​현재AlexaPlusEarlyAccess프로그램사용자를위한모든AmazonMusic구독등급에서사용가능한이기능은음악발견을기본음성명령에서자연스러운대화로전환합니다.사용자는앱의오른쪽하단에있는"a"버튼을탭하고기존검색기능으로는어려운요청을하여AI어시스턴트에액세스할수있습니다.​대화를통한향상된음악발견AlexaPlus는사용자가단편적인가사를사용하여노래를식별하거나,특정연도의차트순위에대해질문하거나,"보이밴드를제외한마돈나같은아티스트의90년대팝"과같은매우구체적인플레이리스트를요청할수있게합니다.이어시스턴트는또한노래의의미를설명하고,샘플의출처를추적하며,아티스트의영향력과디스코그래피에대한상세한지식을제공할수있습니다.​아마존은AlexaPlus를사용하는고객이기존어시스턴트보다3배더많이음악을탐색하며,추천을원하는사용자는거의70%더많은음악을듣는다고보고합니다.이통합은음악스트리밍이AI기능경쟁으로변화함에따라경쟁사들과경쟁하기위한아마존의전략을나타냅니다.​산업AI추진에대한경쟁적대응이번출시는Spotify가10월에ChatGPT기능을통합하여사용자들이대화형프롬프트를통해개인맞춤형음악추천을받을수있게된지불과몇주만에이루어졌습니다.Apple이2026년봄출시예정으로향상된Siri기능을계속개발하고있는동안,Amazon은음악발견을"지식이풍부한친구와의대화"처럼느껴지도록만들어경쟁사들을뛰어넘는위치를점하고있습니다.​AlexaPlus는궁극적으로Prime회원에게무료로제공될예정이며,얼리액세스기간이종료된후Prime비가입자는월$19.99에이용할수있습니다.이통합은주요스트리밍서비스내에서생성형AI어시스턴트의첫번째주요배포중하나입니다.
136 조회
0 추천
11.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입