Loading...

AI 뉴스

스탠포드 연구 결과, AI 챗봇이 사실과 믿음을 구별하는 데 어려움

페이지 정보

작성자 xtalfi
작성일 11.05 16:56
151 조회
0 추천
0 비추천

본문

solen-feyissa-5Ib2B9MBJhQ-unsplash.jpg

(퍼플렉시티가 정리한 기사)


Nature Machine Intelligence에 발표된 포괄적인 연구에 따르면, ChatGPT를 포함한 주요 AI 챗봇들이 참된 믿음과 거짓된 믿음을 안정적으로 구분하지 못하는 것으로 밝혀졌으며, 이는 의료, 법률, 저널리즘과 같은 중요한 분야에서의 배치에 대한 심각한 우려를 제기하고 있다.​


AI 모델들, 신념 인식에서 근본적인 약점 보여

스탠퍼드 대학교 연구진은 13,000개의 질문을 사용하여 24개의 대규모 언어 모델을 테스트한 결과, 모든 시스템이 참인 믿음에 비해 거짓 믿음을 식별하는 데 어려움을 겪는 것으로 나타났다. 연구에 따르면 GPT-4o를 포함하여 2024년 5월 이후에 출시된 최신 모델들은 참인 1인칭 믿음에 비해 거짓 1인칭 믿음을 인정할 가능성이 34.3% 낮았다. 구형 모델들은 더욱 낮은 성능을 보여 거짓 믿음을 정확하게 식별하는 비율이 38.6% 감소했다.​

이러한 모델들은 단순한 참 또는 거짓 진술을 식별할 때 91.1%에서 91.5% 사이의 정확도를 달성했지만, "나는 ...라고 믿는다"와 같은 믿음 기반 언어를 다룰 때는 성능이 급격히 저하되었다. 연구진에 따르면, AI 시스템은 "일관성 없는 추론 전략"을 보였으며, 깊이 있는 이해보다는 피상적인 패턴 매칭에 의존했다.​


실제 응용 분야에 대한 우려 증가

이번 연구 결과는 AI 챗봇 사용이 급속도로 확대되고 있는 중요한 시점에 나왔다. 최근 Adobe Express 보고서에 따르면 ChatGPT를 사용하는 미국인의 77%가 이를 검색 엔진으로 간주하며, 사용자 3명 중 1명은 기존 검색 엔진보다 더 신뢰한다고 밝혔다. 이러한 추세는 규제 조치를 촉발했으며, OpenAI는 2025년 10월 29일부로 ChatGPT가 의료, 법률 또는 금융 조언을 제공하는 것을 공식적으로 금지했다.​

마드리드 자치대학교의 컴퓨터 언어학 전문가인 Pablo Haya Coll은 정확성이 필수적인 중요한 분야에서 "믿음과 지식을 혼동하면 판단에 심각한 오류를 초래할 수 있다"고 경고했다. 연구진은 이러한 한계가 "진단을 오도하고, 사법적 판단을 왜곡하며, 잘못된 정보를 증폭시킬 수 있다"고 강조했다.​

최근 사건들은 실제로 이러한 위험을 부각시켰다. 5월에 캘리포니아 판사는 법률 문서에 AI가 생성한 허위 정보를 포함시킨 두 로펌에 31,000달러의 벌금을 부과했다. 또한 스탠퍼드 대학의 허위정보 전문가는 ChatGPT의 도움으로 작성된 법정 진술서에서 "환각적 인용"을 간과했음을 인정했다.​

연구 저자들은 AI 기술이 고위험 분야에 광범위하게 배포되기 전에 "긴급한 개선"이 필요하다고 결론지었으며, 특히 주관적 믿음과 객관적 사실을 구분하지 못하는 기술의 무능력은 근본적인 구조적 약점을 나타낸다고 밝혔다.

댓글 0
전체 908 / 45 페이지
(퍼플렉시티가정리한기사)세계최대파운드리업체인TaiwanSemiconductorManufacturingCompany는2026년부터첨단반도체노드에대한비용을인상하는이례적인4개 년가격전략을발표했으며,이는인공지능수요가전례없는수준에도달하면서글로벌칩산업의전환점이되고있습니다.이회사는9월에고객들에게가장첨단공정인5nm,4nm,3nm및곧출시될2nm기술에대해2030년까지연평균3-5%의연속적인연간가격인상을통보했습니다.이번인상은복리모델을따르기때문에4년동안누적가격인상률이두자릿수퍼센트에달할수있습니다.​AI붐이수요-공급불균형을초래하다TSMC의가격결정력은AI칩제조분야에서의지배력에서비롯되며,전세계인공지능프로세서의80%이상을생산하고있습니다.회사는2025년3분기에NT$4,523억달러(147억7천만달러)의분기최대이익을기록했으며,이는전년대비39%증가한수치입니다.AI칩을포함하는고성능컴퓨팅이현재전체매출의57%를차지하고있습니다.​C.C.WeiCEO는회사의실적발표에서"AI수요는계속해서매우강력합니다.3개월전우리가예상했던것보다더강력합니다"라고말했습니다.7nm이하의첨단공정은현재TSMC매출의74%를창출하고있으며,5nm가37%,3nm가23%를차지하고있습니다.이수치는2026년2nm생산이본격화되면75%를초과할것으로예상됩니다.​전례없는수요로인해공급부족이발생했으며,업계분석가들은이러한상황이2025년또는2026년까지지속될것으로예상하고있습니다.TSMC는지난1년동안AI칩생산량을두배로늘렸지만,Nvidia,Apple,AMD를포함한주요고객들의수요를충족하는데여전히어려움을겪고있습니다.​산업전반의영향과증가하는비용가격전략은TSMC가저비용제조업체에서프리미엄기술제공업체로전환하고있음을반영한다.현재3나노미터웨이퍼의가격은약2만달러에달하며,곧출시될2나노미터웨이퍼는3만달러를넘어설것으로예상된다.이는칩비용이지속적으로감소하던수십년간의추세를깨는50%의인상이다.​업계분석에따르면"이러한구조적변화는반도체기술의정점에접근하는것이더이상상품이아니라프리미엄서비스임을업계전체에알리는신호"라고한다.가격인상의배경에는막대한자본지출이있는데,여기에는TSMC가애리조나시설에투자한1,650억달러가포함되며,이곳의생산비용은대만공장에비해5~20%더높다.​가격인상소식이전해지자회사의주가는일시적으로1.7%하락했으나,이후회복해지난1년간57%이상상승했다.이는투자자들이TSMC의AI공급망내대체불가능한입지를인식했기때문이다.TrendForce및기타조사기관의애널리스트들은이가격인상이업계전반에걸친반도체비용상승을촉발할것으로예상한다.​주요고객사들은가격인상에대해서로다른반응을보였다.NvidiaCEO젠슨황은"가격인상은그들이제공하는가치에부합하며자연스러운것"이라며TSMC의가격정책을공개적으로지지했다.그러나인상된비용은2026년이후출시되는AI탑재기기,게이밍그래픽카드,차세대프로세서를구매하는소비자에게전가될가능성이높다.
148 조회
0 추천
11.05 등록
(퍼플렉시티가정리한기사)Instacart는화요일인공지능기반의광범위한엔터프라이즈도구세트를공개하며,점점더AI중심으로변화하는시장에서Amazon및Walmart와경쟁하는데필요한기술파트너로자리매김했습니다.이식료품기술회사의새로운"AISolutions"제품군은소매업체들이재고를관리하고,고객을서비스하며,데이터를분석하는방식을혁신하도록설계된다섯가지핵심영역에초점을맞추고있습니다.Kroger,SproutsFarmersMarket,GoodFoodHoldings는이도구를구현하는최초의주요소매업체들중하나입니다.​카트어시스턴트가고객대면혁신을주도하다Instacart발표의핵심은개인맞춤형식사계획,예산조언및제품추천을제공하는AI기반쇼핑도우미인CartAssistant입니다.기본적인챗봇과달리,이도우미는고객상호작용으로부터학습하며온라인및매장내쇼핑환경전반에통합됩니다.​Kroger는iOS모바일앱을통해고객에게CartAssistant를제공하는최초의소매업체중하나가될예정이며,이는Instacart와의이미긴밀한파트너십을확장하는것입니다.Kroger의최고디지털책임자(ChiefDigitalOfficer)이자수석부사장(ExecutiveVicePresident)인YaelCosset은"에이전트쇼핑은미국가정이쇼핑하고식사하는방식을바꿀잠재력을가지고있습니다"라고말했습니다.​SproutsFarmersMarket은앞으로몇달에걸쳐웹사이트,앱및매장내스마트쇼핑카트전반에CartAssistant를통합할계획입니다.이소매업체는이기술이개인맞춤형쇼핑경험을추구하는건강중심고객에게특히가치있다고보고있습니다.​AI기반재고및분석솔루션고객대면도구를넘어,Instacart의엔터프라이즈제품군에는컴퓨터비전을사용하여실시간재고모니터링을제공하는StoreView가포함되어있습니다.이시스템은Instacart쇼퍼와스마트쇼핑카트의이미지및비디오를분석하여재고가부족하거나완전히품절된제품을자동으로식별합니다.​GoodFoodHoldings는이미StoreView를사용하고있으며,이소매업체는해당기술이고객경험향상을위한"강력한새로운가시성계층"을제공한다고언급했습니다.이시스템은온라인및매장내쇼핑객모두를위한제품가용성을보장하면서운영마찰을줄이는것을목표로합니다.​회사의CatalogEngine은AI를사용하여제품정보에서13억개이상의데이터포인트를추출하여영양성분,알레르기유발물질정보및맥락적속성으로카탈로그를강화합니다.이를통해모든쇼핑채널에서보다정확한검색결과와개인화된추천이가능합니다.​식료품AI분야의경쟁심화이번발표는주요소매업체들이AI기반쇼핑솔루션도입경쟁을벌이고있는가운데나왔습니다.월마트는"Sparky"AI어시스턴트를출시했으며ChatGPT를통한쇼핑을가능하게하기위해OpenAI와의파트너십을발표했습니다.아마존은당일식료품배송을1,000개이상의도시로확대하는동시에AI기반물류혁신을개발하고있습니다.​Instacart의CEO인ChrisRogers는"AI는사람들이식료품을쇼핑하고가족을부양하는방식을변화시키고있으며,Instacart는소매업체를돕기위한독보적인위치에있습니다"라고말했습니다.이회사는1,800개이상의소매파트너와협력하고있으며북미전역의거의100,000개매장에서비스를제공하고있습니다.​업계분석가들은식료품소매업체들이2025년까지AI지출을4배로늘릴것으로예상하며,2030년까지1,360억달러의잠재적가치창출이가능할것으로전망합니다.이기술은전통적으로식품공급의30%이상이낭비로손실되는재고관리의지속적인과제를해결할것으로기대됩니다.
148 조회
0 추천
11.05 등록
(퍼플렉시티가정리한기사)OpenAI는Sora2텍스트-투-비디오플랫폼을통해AI생성비디오에사용할마스코트와사랑받는캐릭터의라이선스를확보하기위해주요브랜드들에적극적으로접근하고있으며,이는엔터테인먼트기업들로부터증가하는저작권압력을헤쳐나가면서합법적인브랜드파트너십으로나아가는중요한전환점을나타냅니다.이러한접촉은Sora2가9월말출시되었을때기본적으로사용자가저작권이있는캐릭터가등장하는비디오를생성할수있도록허용하는옵트아웃시스템으로즉각적인반발에직면한후적절한라이선스프레임워크를구축하려는OpenAI의시도를나타냅니다.출시72시간내에회사는할리우드스튜디오,탤런트에이전시및콘텐츠제작자들의비판에따라방향을전환하여옵트인모델로전환했습니다.​수익분배모델이형성되다OpenAICEO샘알트먼은AI생성콘텐츠에자신의캐릭터사용을허용하는저작권보유자에게보상하는수익분배모델계획을발표했습니다.이수익화전략은사용자들이예상보다높은비율로비디오를생성하면서회사자원에재정적압박을가하고있는상황에서나온것입니다.​알트먼은블로그게시물에서"이새로운종류의'인터랙티브팬픽션'에대해매우흥분하고있는많은권리보유자들로부터연락을받고있으며,이들은이새로운형태의참여가자신들에게많은가치를가져다줄것이라고생각합니다"라고밝혔습니다.​수익분배체계는Sora의"캐릭터카메오"기능을통해구현될예정이며,이기능은사용자가사람,반려동물,물체또는독창적인페르소나의업로드된비디오로부터재사용가능한아바타를생성할수있도록합니다.권리보유자들은사용을완전히금지하는것을포함하여자신의캐릭터가어떻게사용되는지지정할수있습니다.​엔터테인먼트업계의반발이심화되다주요엔터테인먼트기업들은OpenAI의접근방식에강력히반발해왔습니다.미국영화협회(MotionPictureAssociation)는OpenAI에게플랫폼에서광범위한저작권침해로묘사되는문제를해결하기위한"즉각적인조치"를취할것을촉구했습니다.이문제에정통한소식통에따르면,디즈니는이미Sora2에서자사콘텐츠사용을거부했습니다.​이러한반발은국제적으로확대되어,스튜디오지브리와스퀘어에닉스를포함한회원사들로구성된일본업계단체CODA가OpenAI에게Sora2훈련에자사콘텐츠사용을중단할것을요구하는서한을발송했습니다.이논란은앱출시후소셜미디어전반에확산된피카츄,스폰지밥,마리오와같은캐릭터가등장하는AI생성동영상으로인해더욱가속화되었습니다.​이러한법적문제는훈련데이터셋에서저작권이있는자료사용을둘러싼AI업계의광범위한긴장을반영합니다.OpenAI는조지R.R.마틴과마이클샤본을포함한작가들로부터여러소송에직면해있으며,최근연방판사가집단소송을진행하도록허용했습니다.
159 조회
0 추천
11.05 등록
(퍼플렉시티가정리한기사)CelonisSE는연례Celosphere2025컨퍼런스에서주요AI기반플랫폼업데이트를발표했으며,120개의"ValueChampions"가각각1,000만달러이상의비즈니스가치를실현하여프로세스인텔리전스로구동되는엔터프라이즈AI를통해총81억달러의가치를창출한방법을선보였습니다.​뮌헨에본사를둔이프로세스인텔리전스회사는3,500명이상의비즈니스및기술리더들이모인이틀간의컨퍼런스에서플랫폼에대한중요한개선사항을공개했습니다.이번발표는Celonis를AI기반운영의기반으로포지셔닝하며,AI투자에대한수익달성에어려움을겪고있는조직들의광범위한과제를해결합니다.​플랫폼혁신이AI기반운영을가능하게합니다Celonis는회사가"AI기반컴포저블엔터프라이즈"라고부르는것을구동하기위해설계된여러주요기술혁신을도입했습니다.향상된프로세스인텔리전스플랫폼은이제PerformanceSpectrum,InstanceExplorer,Object-CentricPerformance앱을포함한객체중심프로세스마이닝(OCPM)기능을갖추고있으며,이는장애가자주발생하는중요한프로세스교차점에서문제를식별하는데도움을줍니다.​회사는프로세스인텔리전스를위해특별히구축된세계최초의ModelContextProtocol(MCP)서버를출시했으며,이는효과적인의사결정에필요한동적운영컨텍스트를AI에이전트에제공하도록설계되었습니다.또한OrchestrationEngine은핵심플랫폼기능으로서사람및시스템과함께AI에이전트를조정하도록확장되었습니다.​Celonis의최고제품책임자인DanielBrown은에이전틱AI에필요한구조화된접근방식을강조했습니다:"AI를진정으로운영화하려면올바른사용사례를식별하고,비즈니스프로세스를재설계하며,사람과기존시스템과함께에이전트를조정해야합니다".​전략적파트너십및고객성공사례주요하이라이트는프로세스인텔리전스를통해AI를운영화하기위한Databricks와의파트너십발표였습니다.이통합은DeltaSharing을활용하여CelonisProcessIntelligencePlatform과DatabricksDataIntelligencePlatform을직접연결하며,데이터복제없이양방향데이터흐름을가능하게합니다.​Mercedes-BenzGroupAG는Celonis와의협력을통해30개이상의글로벌생산공장에서정시배송개선과의사결정가속화라는혁신적인성과를선보였습니다.이자동차제조사는배송예측을위한AI코파일럿,서비스병목현상식별을위한프로세스인텔리전스,품질관리를위한AI기반이상탐지를활용하고있습니다.​컨퍼런스에서강조된다른주목할만한고객성과로는Celonis를기반으로한AstraZeneca의OpenAI와의파트너십,오클라호마주의1천만달러가치창출,그리고Cosentino가AI기반신용관리를통해차단된판매주문처리를최대5배가속화한사례등이있습니다.
148 조회
0 추천
11.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입