Loading...

AI 뉴스

스탠포드 연구 결과, AI 챗봇이 사실과 믿음을 구별하는 데 어려움

페이지 정보

작성자 xtalfi
작성일 2025.11.05 16:56
1,360 조회
0 추천
0 비추천

본문

solen-feyissa-5Ib2B9MBJhQ-unsplash.jpg

(퍼플렉시티가 정리한 기사)


Nature Machine Intelligence에 발표된 포괄적인 연구에 따르면, ChatGPT를 포함한 주요 AI 챗봇들이 참된 믿음과 거짓된 믿음을 안정적으로 구분하지 못하는 것으로 밝혀졌으며, 이는 의료, 법률, 저널리즘과 같은 중요한 분야에서의 배치에 대한 심각한 우려를 제기하고 있다.​


AI 모델들, 신념 인식에서 근본적인 약점 보여

스탠퍼드 대학교 연구진은 13,000개의 질문을 사용하여 24개의 대규모 언어 모델을 테스트한 결과, 모든 시스템이 참인 믿음에 비해 거짓 믿음을 식별하는 데 어려움을 겪는 것으로 나타났다. 연구에 따르면 GPT-4o를 포함하여 2024년 5월 이후에 출시된 최신 모델들은 참인 1인칭 믿음에 비해 거짓 1인칭 믿음을 인정할 가능성이 34.3% 낮았다. 구형 모델들은 더욱 낮은 성능을 보여 거짓 믿음을 정확하게 식별하는 비율이 38.6% 감소했다.​

이러한 모델들은 단순한 참 또는 거짓 진술을 식별할 때 91.1%에서 91.5% 사이의 정확도를 달성했지만, "나는 ...라고 믿는다"와 같은 믿음 기반 언어를 다룰 때는 성능이 급격히 저하되었다. 연구진에 따르면, AI 시스템은 "일관성 없는 추론 전략"을 보였으며, 깊이 있는 이해보다는 피상적인 패턴 매칭에 의존했다.​


실제 응용 분야에 대한 우려 증가

이번 연구 결과는 AI 챗봇 사용이 급속도로 확대되고 있는 중요한 시점에 나왔다. 최근 Adobe Express 보고서에 따르면 ChatGPT를 사용하는 미국인의 77%가 이를 검색 엔진으로 간주하며, 사용자 3명 중 1명은 기존 검색 엔진보다 더 신뢰한다고 밝혔다. 이러한 추세는 규제 조치를 촉발했으며, OpenAI는 2025년 10월 29일부로 ChatGPT가 의료, 법률 또는 금융 조언을 제공하는 것을 공식적으로 금지했다.​

마드리드 자치대학교의 컴퓨터 언어학 전문가인 Pablo Haya Coll은 정확성이 필수적인 중요한 분야에서 "믿음과 지식을 혼동하면 판단에 심각한 오류를 초래할 수 있다"고 경고했다. 연구진은 이러한 한계가 "진단을 오도하고, 사법적 판단을 왜곡하며, 잘못된 정보를 증폭시킬 수 있다"고 강조했다.​

최근 사건들은 실제로 이러한 위험을 부각시켰다. 5월에 캘리포니아 판사는 법률 문서에 AI가 생성한 허위 정보를 포함시킨 두 로펌에 31,000달러의 벌금을 부과했다. 또한 스탠퍼드 대학의 허위정보 전문가는 ChatGPT의 도움으로 작성된 법정 진술서에서 "환각적 인용"을 간과했음을 인정했다.​

연구 저자들은 AI 기술이 고위험 분야에 광범위하게 배포되기 전에 "긴급한 개선"이 필요하다고 결론지었으며, 특히 주관적 믿음과 객관적 사실을 구분하지 못하는 기술의 무능력은 근본적인 구조적 약점을 나타낸다고 밝혔다.

댓글 0
전체 1,366 / 89 페이지
(퍼플렉시티가정리한기사)주요음반사들과의저작권분쟁의중심에있는AI음악생성플랫폼Suno는수요일,MenloVentures가주도한시리즈C펀딩라운드에서2억5천만달러를유치했다고발표했으며,매사추세츠에본사를둔이회사의기업가치는24억5천만달러로평가되었습니다.이번펀딩은Suno가연간2억달러의매출을보고하고플랫폼에서거의1억명의사용자가음악을창작했다고주장하는가운데이루어졌습니다.​이번라운드에는Nvidia의벤처캐피탈부문인NVentures와함께HallwoodMedia,Lightspeed,Matrix가참여했습니다.이번기업가치평가는Suno가2024년5월1억2천5백만달러규모의시리즈B투자유치시확보했던약5억달러의기업가치에서거의다섯배증가한수치입니다.​법적공방이계속되다이번자금조달발표는Suno가2024년6월소니뮤직,유니버설뮤직그룹,워너뮤직그룹이제기한저작권침해소송에여전히휘말려있는가운데나왔습니다.음반사들은Suno가허가없이저작권이있는음악으로AI모델을훈련시켰다고주장하며,침해된저작물당최대15만달러를청구하고있습니다.​최근유니버설및워너와저작권소송을합의하고2026년출시예정인라이선스AI음악플랫폼계획을발표한경쟁사Udio와달리,Suno는공정이용원칙에따라저작권이있는자료의사용을계속옹호하고있습니다.이회사는덴마크음악권리기구Koda와독일저작권협회GEMA로부터도추가소송을받고있습니다.​플랫폼역량확장Suno는2025년9월에v5음악모델을출시했으며,회사는이를향상된오디오품질,사실적인보컬,그리고강화된창작제어기능을갖춘가장진보된시스템이라고설명합니다.며칠후,사용자가AI생성스템으로트랙을편집할수있는생성형오디오워크스테이션인SunoStudio를선보였습니다.​CEOMikeyShulman은"단2년만에처음창작하는사람부터일상워크플로우에이도구를통합하는최고의작곡가와프로듀서에이르기까지수백만명의사람들이Suno를통해자신의아이디어를현실로만드는것을보았습니다"라고말했습니다.​완전히합성된트랙이스트리밍플랫폼에넘쳐나면서더넓은AI음악환경은정밀조사를받고있습니다.Deezer는2025년11월에매일50,000개이상의AI생성트랙을받았으며,이는전체업로드의34%를차지하고,이러한트랙의스트림중최대70%가사기로감지되었다고보고했습니다.​MenloVentures의파트너AmyMartin은Suno가"사람들이진정으로사용하기를좋아하는것을구축했으며수백만명의팬이매일플랫폼에서오리지널곡을만들고친구들과공유하고있습니다"라고말했습니다.
887 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)워너뮤직그룹(WarnerMusicGroupCorp.)은2025년11월19일,인공지능기업스태빌리티AI(StabilityAI)와의파트너십을발표하면서,윤리적으로학습된AI모델을활용해전문가용음악창작도구를개발하겠다고밝혔습니다.이는음악산업의생성형기술접근방식에있어또하나의최신변화를의미합니다.양사발표에따르면,이번협력은아티스트,작곡가,프로듀서들이창의적인통제권을유지한채실험하고작곡할수있도록하는도구개발에중점을둘예정입니다.이이니셔티브는워너뮤직이소송이아닌라이선스파트너십을통한AI도입전략의일환으로,오로지허가된음악데이터를통해모델을훈련시킨다는점이특징입니다.​업계,소송에서라이선스체제로전환이번발표는주요음반사들이저작권분쟁에서AI기업들과의상업적합의로이동하는광범위한추세를따른것입니다.StabilityAI는이전에2025년10월UniversalMusicGroup과유사한계약을체결했으며,WarnerMusic은같은날AI음악플랫폼Udio와의저작권소송을합의하고2026년에출시될라이선스음악제작서비스개발에합의했다고별도로발표했습니다.​WarnerMusic의최고디지털책임자인CarlettaHigginson은"이번협력은음악창작자들의권리와무결성을보호하면서창의적가능성을확장하는책임감있고아티스트친화적인AI도구를개발하기위한중요한단계를나타냅니다"라고말했습니다.양사는도구설계를형성하고창작자들이자신의작품에대한통제권을유지하도록보장하기위해아티스트들과직접협력할것임을강조했습니다.​완전히라이선스된데이터로학습하는StabilityAI의StableAudio플랫폼이이번파트너십을지원할예정입니다.CEOPremAkkaraju가이끌고영화제작자JamesCameron이이사회에참여하고있는이회사는상업적으로안전한생성형오디오분야의업계선두주자로자리매김하고있습니다.Akkaraju는"StabilityAI에서우리는아티스트를중심에두고그들의창작과정을지원하는도구를구축합니다"라고말했습니다.
910 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)네이버클라우드가주도한컨소시엄이과학기술정보통신부와정보통신산업진흥원(NIPA)의'AI반도체팜구축및실증'사업을성공적으로완료했다고20일밝혔다.2023년5월부터2025년11월까지3개 년에걸쳐진행된이국가전략프로젝트는국산신경망처리장치(NPU)기반클라우드인프라를구축하고실제산업환경에서성능을검증하는것을목표로했다.​국산NPU의경쟁력입증네이버클라우드는KT클라우드,NHN클라우드와컨소시엄을구성하고국내AI반도체기업인퓨리오사AI,리벨리온과협력해핵심과업을달성했다.연산용량총19.95페타플롭스(PF)규모의국산AI반도체팜을구축했으며,클라우드플랫폼구축및운영과4개의AI응용서비스실증을완료했다.​특히올해마지막3차년도에는국산NPU의상용화가능성을높이는실질적성과를거뒀다.한국인정기구(KOLAS)인증시험검사기관인AI웍스가국산NPU의효율성,안정성,응답속도등주요지표를측정한결과,일부모델이외산GPU대비우수한성능을보이며경쟁력을입증했다.​의료·번역등다양한분야적용실증과정에서는다양한AI서비스가구현됐다.네이버클라우드는퓨리오사AI와함께외국인근로자의원활한소통을위한대형언어모델(LLM)기반번역·챗봇서비스를실증했으며,해당서비스는서울AI허브와제주위미농협에적용됐다.​KT클라우드와NHN클라우드는리벨리온과협력해의료분야에집중했다.뇌질환진단·예측AI플랫폼을가천대길병원에적용해의료진의정밀검진과업무효율을높였으며,뇌파분석AI서비스는우리들녹지국제병원에서우울증조기탐지의임상적유효성을입증했다.​이종복네이버클라우드이사는"이번사업은국산NPU기술이실제산업현장에적용되는중요한전환점으로,앞으로국산NPU중심으로클라우드와AI서비스가결합된새로운생태계가형성될것"이라며"정부와업계가지속적으로협력해AI생태계를확장하고국산NPU기술이산업전반에적용될수있도록노력하겠다"고밝혔다.
907 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)ProgressSoftware은화요일에자사의노코드인공지능플랫폼인ProgressAgenticRAG가이제AWSMarketplace를통해제공되며,비정형데이터에서인사이트를추출하려는기업의배포를간소화한다고발표했습니다.​SaaS기반검색증강생성(Retrieval-AugmentedGeneration)플랫폼은프로그래밍전문지식없이도AI에이전트를사용하여문서,오디오,비디오및다국어텍스트를실행가능한인텔리전스로변환할수있도록합니다.이번등록을통해고객은AWSBedrock모델과통합하면서AWS환경내에서직접플랫폼을발견하고구매하며배포할수있습니다.​기업용AI에대한접근성확대"ProgressAgenticRAG를AWSMarketplace에도입함으로써고객들이고급AI에더쉽게접근할수있도록할수있습니다"라고ProgressSoftware의애플리케이션및데이터플랫폼부문EVP겸총괄관리자인JohnAinsworth가말했습니다."혁신의속도가가속화됨에따라,우리는조직들이혁신적인AI솔루션을자신감있게채택하고확장할수있도록장벽을제거하는데주력하고있습니다."​이플랫폼은다국어비정형데이터를처리하고소스자료와연결된검증가능하고추적가능한결과물을제공하여AI정확성과규정준수에대한기업의우려를해결합니다.조직들은데이터거버넌스에대한통제권을유지하면서엔터프라이즈급대규모언어모델중에서선택할수있습니다.​RAG솔루션의성장하는시장이번출시는글로벌RAG시장이급속한성장을경험하고있는가운데이루어졌습니다.MarketsandMarkets보고서에따르면,시장규모는2025년19억4천만달러에서2030년98억6천만달러로성장할것으로예상되며,기업들은자체데이터에기반한응답을생성하는AI시스템을점점더많이도입하고있습니다.다른추정치에서는2025년시장규모를18억5천만달러로보고2034년까지670억달러에이를것으로전망합니다.​AWSMarketplace는전략적기업채널로부상했으며,2025년7월Canalys보고서에따르면클라우드마켓플레이스소프트웨어판매액은2028년까지850억달러에달할것으로예상됩니다.수십만개기업의400만명이상의개발자와기술전문가에게서비스를제공하는ProgressSoftware는고객지원,법무,제품관리및비즈니스인텔리전스팀을위한플랫폼으로자리매김하고있습니다.
910 조회
0 추천
2025.11.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입