Loading...

AI 뉴스

스탠포드 연구 결과, AI 챗봇이 사실과 믿음을 구별하는 데 어려움

페이지 정보

작성자 xtalfi
작성일 11.05 16:56
62 조회
0 추천
0 비추천

본문

solen-feyissa-5Ib2B9MBJhQ-unsplash.jpg

(퍼플렉시티가 정리한 기사)


Nature Machine Intelligence에 발표된 포괄적인 연구에 따르면, ChatGPT를 포함한 주요 AI 챗봇들이 참된 믿음과 거짓된 믿음을 안정적으로 구분하지 못하는 것으로 밝혀졌으며, 이는 의료, 법률, 저널리즘과 같은 중요한 분야에서의 배치에 대한 심각한 우려를 제기하고 있다.​


AI 모델들, 신념 인식에서 근본적인 약점 보여

스탠퍼드 대학교 연구진은 13,000개의 질문을 사용하여 24개의 대규모 언어 모델을 테스트한 결과, 모든 시스템이 참인 믿음에 비해 거짓 믿음을 식별하는 데 어려움을 겪는 것으로 나타났다. 연구에 따르면 GPT-4o를 포함하여 2024년 5월 이후에 출시된 최신 모델들은 참인 1인칭 믿음에 비해 거짓 1인칭 믿음을 인정할 가능성이 34.3% 낮았다. 구형 모델들은 더욱 낮은 성능을 보여 거짓 믿음을 정확하게 식별하는 비율이 38.6% 감소했다.​

이러한 모델들은 단순한 참 또는 거짓 진술을 식별할 때 91.1%에서 91.5% 사이의 정확도를 달성했지만, "나는 ...라고 믿는다"와 같은 믿음 기반 언어를 다룰 때는 성능이 급격히 저하되었다. 연구진에 따르면, AI 시스템은 "일관성 없는 추론 전략"을 보였으며, 깊이 있는 이해보다는 피상적인 패턴 매칭에 의존했다.​


실제 응용 분야에 대한 우려 증가

이번 연구 결과는 AI 챗봇 사용이 급속도로 확대되고 있는 중요한 시점에 나왔다. 최근 Adobe Express 보고서에 따르면 ChatGPT를 사용하는 미국인의 77%가 이를 검색 엔진으로 간주하며, 사용자 3명 중 1명은 기존 검색 엔진보다 더 신뢰한다고 밝혔다. 이러한 추세는 규제 조치를 촉발했으며, OpenAI는 2025년 10월 29일부로 ChatGPT가 의료, 법률 또는 금융 조언을 제공하는 것을 공식적으로 금지했다.​

마드리드 자치대학교의 컴퓨터 언어학 전문가인 Pablo Haya Coll은 정확성이 필수적인 중요한 분야에서 "믿음과 지식을 혼동하면 판단에 심각한 오류를 초래할 수 있다"고 경고했다. 연구진은 이러한 한계가 "진단을 오도하고, 사법적 판단을 왜곡하며, 잘못된 정보를 증폭시킬 수 있다"고 강조했다.​

최근 사건들은 실제로 이러한 위험을 부각시켰다. 5월에 캘리포니아 판사는 법률 문서에 AI가 생성한 허위 정보를 포함시킨 두 로펌에 31,000달러의 벌금을 부과했다. 또한 스탠퍼드 대학의 허위정보 전문가는 ChatGPT의 도움으로 작성된 법정 진술서에서 "환각적 인용"을 간과했음을 인정했다.​

연구 저자들은 AI 기술이 고위험 분야에 광범위하게 배포되기 전에 "긴급한 개선"이 필요하다고 결론지었으며, 특히 주관적 믿음과 객관적 사실을 구분하지 못하는 기술의 무능력은 근본적인 구조적 약점을 나타낸다고 밝혔다.

댓글 0
전체 815 / 20 페이지
(퍼플렉시티가정리한기사)Snowflake는오늘사용자가자연어로복잡한비즈니스질문을하고데이터에서실행가능한인사이트를받을수있는엔터프라이즈AI에이전트플랫폼인SnowflakeIntelligence의정식출시를발표했습니다.이번출시로12,000개이상의조직으로구성된Snowflake의글로벌고객기반에이기술이제공됩니다.회사의BUILD2025개발자컨퍼런스에서발표된이번공지는엔터프라이즈고객을위한인공지능역량의중요한확장을의미합니다.지난3개월동안만1,000명이상의Snowflake고객이플랫폼을사용하여비즈니스전반에걸쳐15,000개이상의AI에이전트를배포했습니다.​주요기업들이극적인시간절감효과를보고하다얼리어답터들은이기술로부터상당한운영개선을보고하고있습니다.ToyotaMotorEurope은에이전트배포일정을"몇달에서몇주로"단축했다고회사의데이터및AI책임자인ThierryMartin이밝혔습니다.Cisco는"대량의데이터를통합하고분석하여더큰자동화와빠른의사결정의길을여는"내부AI에이전트를개발하기위해이플랫폼을사용하고있다고회사의SVP겸최고자동화책임자인SriniNamineni가말했습니다.​Fanatics는고객세분화및광고활동을강화하기위해이시스템을활용하고있으며,Wolfspeed는12개이상의AI에이전트를프로덕션에구현하여장비문제를"2시간이아닌2분"만에해결하고있습니다.내부적으로Snowflake의자체AI어시스턴트는6,000명이상의직원이사용하고있으며매주12,500개이상의질문에답변하고있습니다.​전통적인AI를넘어선고급기능SnowflakeIntelligence는새로운AgenticDocumentAnalytics기능을통해수천개의문서를동시에분석할수있게함으로써기존의검색증강생성시스템과차별화됩니다.이플랫폼은SalesforceData360,SharePoint,Slack,MicrosoftTeams를포함한소스의구조화된데이터와비구조화된데이터를통합할수있습니다.​Snowflake의제품담당EVP인ChristianKleinerman은"AI의진정한가치와파괴적잠재력은기업데이터와의연결에서발생한다"고말했습니다.회사의AI연구팀은텍스트-SQL쿼리에서플랫폼을최대3배더빠르게만들었으며,표준데이터셋으로테스트했을때최대95%의오류를포착하는AgentGPA라는평가프레임워크를개발했습니다.​이번발표는Snowflake주가가지난1년간143.7%급등하여52주최고가인$280.67근처에서거래되고있는가운데나왔습니다.회사는마이너스수익을보고했음에도불구하고현재$939억달러의가치를평가받고있으며,애널리스트들은올회계연도에수익성을달성할것으로예측하고있습니다.
64 조회
0 추천
11.05 등록
(퍼플렉시티가정리한기사)코카콜라컴퍼니는2025년연말광고를전적으로인공지능으로제작하여월요일에공개한뒤,광범위한비판에직면했습니다.이는음료대기업이AI기반크리스마스광고로논란을일으킨두번째연속적인해입니다.11월3일공개된60초짜리"HolidaysAreComing"광고는그래픽AI스튜디오Silverside와SecretLevel을사용하여1995년코카콜라의상징적인크리스마스광고를재현한것입니다.미디어정보기업CARMA에따르면,대중의반응은부정적감정이32%로,긍정적인반응10.2%에비해크게높았으며,이는캠페인전의31.4%부정적,23.8%긍정적반응에서상당히악화된수치입니다.​AI전략에대한임원진의방어비판이거세지고있음에도불구하고,코카콜라경영진들은그들의AI전략에대해단호한입장을유지했다.회사의글로벌부사장이자생성형AI총괄인프라틱타카르(PratikThakar)는TheHollywoodReporter와의인터뷰에서"지니는이미병에서나왔고,다시집어넣을수없다"고말했다.​"작년에는사람들에게는장인정신이부족하다고비판받았지만,올해는장인정신이10배더좋아졌다"고타카르는말했다.일부업계전문가들은여전히불만족스러워했으나,소비자참여지표가그들의접근방식을뒷받침한다고그는인정했다.​SecretLevel의창립자인제이슨자다(JasonZada)는온라인비판자들을"가장목소리가큰"사람들로치부하며,"작년에불평하던사람들은대부분창작업계종사자들이었고,그들은두려웠다—자신들의일자리에대한두려움,그것이가져오는변화에대한두려움이었다"고기자들에게말했다.​기술생산및비용절감이캠페인은5명의AI전문가가70,000개이상의생성된비디오클립을정제하는작업을수행했으며,총약100명의팀원과함께작업했습니다.이는전통적인제작과유사하지만일반적인1년의타임라인대신약한달만에완성되었습니다.최고마케팅책임자마놀로아로요(ManoloArroyo)는AI접근법이기존방법보다더빠르고저렴하다고말하며재정적이익을강조했습니다.​올해버전은2024년의기술적결함들을해결했는데,여기에는트럭바퀴의적절한회전과이전캠페인에서특히비판을받았던섬뜩한인간캐릭터대신애니메이션동물들에초점을맞추는것이포함됩니다.​이광고는코카콜라의상징적인빨간트럭들이눈덮인풍경을여행하는모습을담고있으며,북극곰,팬더,나무늘보,토끼를포함한다양한동물들이경이로워하며지켜보고,산타클로스가콜라병을여는장면으로마무리됩니다.​산업및소비자반응온라인반응은여전히​​압도적으로부정적이었으며,소셜미디어이용자들은해당광고를"역겹다","영혼이없다","싸구려"라고부르며비난했다.한바이럴댓글은이를"내가본최고의펩시광고"라고표현하기도했지만,다른이들은코카콜라가예술적진정성보다비용절감을우선시했다고비판했다.​"정말역겹네요.당신들은수십억달러규모의회사잖아요.진짜애니메이터들에게돈을주세요,"라고한사용자는,막대한자원을보유하고서도AI를사용하기로한회사의결정에대한대중의광범위한정서를대변했다.​이논란은대형브랜드들이콘텐츠제작에AI도구를점점더많이도입하는가운데,직업상실과전통적으로감정적연결에의존하는연말연시광고에서인간의창의성이사라질수있다는우려등,창의산업내의더넓은긴장을반영한다.
61 조회
0 추천
11.05 등록
(퍼플렉시티가정리한기사)마이크로소프트은10억달러규모의기후혁신기금중8억달러이상을탄소제거기술,친환경철강생산,인공지능솔루션개발을가속화하기위해투입했습니다.이들솔루션은데이터센터운영에서배출을줄이는것을목표로하고있습니다.이투자전략은기업의기후자금이어떻게승수효과를창출할수있는지를보여주며,회사의초기약속이5년동안120억달러의광범위한기후기술금융으로확대되는결과를가져왔습니다.​전략적투자접근법은공급망배출을목표로한다이기술대기업의접근방식은직접투자와조달약정을결합해벗어나기어려운산업전반에걸쳐신흥기후기술의규모를확대합니다.마이크로소프트는2020년펀드를출범한이후67개의지속가능기술벤처에거의8억달러를투자했으며,데이터센터건설에필수적인저탄소소재에특히중점을두고있습니다.​최근의합의는이전략이실행되고있음을보여줍니다.9월에는마이크로소프트가스웨덴의친환경철강생산업체Stegra와기존방법에비해최대95%적은배출량으로제조된철강을데이터센터장비용으로공급하기위한계약을체결했습니다.또한Fortera에투자하여연간40만톤의저탄소시멘트를생산하는상업시설건설을지원했는데,이시멘트는배출량을70%까지줄일수있습니다.​탄소제거투자급속히확대마이크로소프트는전세계적으로탄소제거크레딧의최대기업구매자로부상했으며,총구매량은3천만톤을초과합니다.최근마이크로소프트는VaultedDeep과의중요한계약을통해2038년까지최대490만톤의영구적인이산화탄소를제거하기로합의했으며,이는기록상두번째로큰탄소제거계약입니다.또한UNDO와협력하여강화된암석풍화기술을통해영구적으로28,900톤의이산화탄소를제거하기로계약했습니다.​이러한투자는마이크로소프트의증가하는배출량문제에대응하기위한것으로,회사는2025회계연도에데이터센터인프라에800억달러를지출할계획입니다.회사의배출량은2030년까지탄소네거티브가되겠다고발표한이후거의30%증가했으며,이는대부분에너지집약적인AI데이터센터확장때문입니다.​기후혁신기금(ClimateInnovationFund)의확장효과는마이크로소프트의조달전략을통한직접투자를넘어확장되고있습니다.이전략은시장수요를알리고,기후기술프로젝트의자금조달을가능하게합니다."우리는수요신호를주고,프로젝트자금조달을가능하게하며,전세계적인생산을가속화하는것을목표로하고있습니다."라고최고지속가능성책임자멜라니나카가와(MelanieNakagawa)는말했습니다.
64 조회
0 추천
11.05 등록
(퍼플렉시티가정리한기사)재무장관스콧베센트는화요일엔비디아의첨단블랙웰칩이기술발전과차세대반도체출현에따라결국중국에판매될수있다고제안했으며,이는칩수출에대한행정부의이전강경입장을완화하는것처럼보입니다."앞으로어느시점에서-엔비디아에서일어나는놀라운혁신을고려할때12개월인지24개월인지는모르겠지만-블랙웰칩이효능면에서그들의칩스택에서두세단계또는네단계아래로내려갈수있습니다"라고베센트는CNBC에말했습니다."그시점에서그것들은판매될수있습니다."​트럼프의이전입장에서의전환이러한발언은Nvidia의가장첨단AI칩이미국전용으로만남을것이라는트럼프대통령의최근선언에서주목할만한변화를나타냅니다.불과며칠전,트럼프는"가장첨단기술은미국외에는누구에게도허용하지않을것"이라고명백히밝혔습니다.​재무장관의발언은지난주한국에서열린트럼프와시진핑중국국가주석간의고위급정상회담이후미중무역관계의보다광범위한해빙분위기속에서나왔습니다.이회담은백악관이"역사적"이라고부르는무역협정을이끌어냈으며,여기에는펜타닐유입억제와희토류수출제한중단에대한중국의약속이포함되어있습니다.​전략적수출통제진화베센트는블랙웰칩을엔비디아의현재제품중"최고의보석"으로특징지었지만,급속한기술발전이이를빠르게전략적으로덜민감하게만들수있다고강조했다.행정부는중국의잠재적인군사적기술응용에대한국가안보우려를이유로첨단AI칩에대한엄격한수출통제를유지해왔다.​현재미국정책은미국칩제조업체들이중국판매수익의15%를공유하도록요구하고있으며,기존제한조치는구형의덜강력한칩만수출할수있도록허용하고있다.CEO젠슨황에따르면,이러한제약하에서엔비디아의중국시장점유율은제로로떨어진것으로알려졌다.​베센트는또한미중관계가현재"좋은상태"에있다고언급했으며,트럼프와시진핑이다가오는G20정상회의에서다시만날수있다고밝혔다.재무장관의발언은행정부가중국과의광범위한전략적경쟁의일환으로기술수출에대해보다유연한접근방식을고려하고있음을시사한다.
63 조회
0 추천
11.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입