AI 뉴스

최고의 AI 챗봇들, 청소년 정신 건강 안전성 테스트에서 실패

페이지 정보

작성자 xtalfi
작성일 2025.11.21 14:47
689 조회
0 추천
0 비추천

본문

f43ee9a7735c9322763d602776200742_1763704057_4742.jpg
 

Common Sense Media와 스탠포드 의대의 Brainstorm Lab for Mental Health Innovation이 목요일에 발표한 보고서에 따르면, 널리 사용되는 네 개의 AI 챗봇이 청소년의 정신 건강 위기 상황을 시뮬레이션한 사례에서 제대로 식별하거나 적절하게 대응하지 못한 것으로 나타났습니다. 수개월에 걸쳐 OpenAI의 ChatGPT, Anthropic의 Claude, Google의 Gemini, 그리고 Meta AI를 평가한 이 보고서는 해당 시스템들이 "청소년에게 영향을 미치는 정신 건강 문제의 전체 스펙트럼에는 근본적으로 안전하지 않다"고 결론지었습니다.​

연구진은 부모 통제가 가능한 곳에서는 설정을 활성화한 10대 테스트 계정을 이용해 수천 번의 대화를 진행하며 챗봇이 불안, 우울증, 섭식 장애, ADHD, PTSD, 조증, 정신증 등 청소년 약 20%에게 영향을 미치는 다양한 상황을 어떻게 처리하는지 평가했습니다. 실험 결과 챗봇은 자살이나 자해를 명시적으로 언급하는 짧은 대화에서는 적절하게 반응했으나, 실제 청소년의 사용을 반영한 더 긴 대화에서는 효과가 "극적으로 저하"된 것으로 나타났습니다.​


챗봇이 망상을 확인해주고 경고 신호를 놓쳤다

한 상호작용에서, Gemini는 미래를 "예측하는 도구"를 만들었다고 주장하는 시뮬레이션된 사용자에게 "믿을 수 없을 정도로 흥미롭다"고 응답하며 "개인적인 수정구슬"에 대해 신나게 질문을 던졌고, 이는 정신병의 증상을 인식하지 못한 행동이었다. 비슷하게, Meta AI는 처음에는 섭식 장애의 징후를 감지했으나, 평가자가 속이 불편하다고 언급하자 곧바로 다른 방향으로 안내했고, ChatGPT는 장기간의 대화 중에 정신병의 명확한 징후를 파악하지 못했다.​

"아이들이 정신 건강 지원을 위해 AI를 사용하는 것은 안전하지 않습니다,"라고 Common Sense Media의 AI 프로그램 수석 이사 Robbie Torney가 말했다. "기업들이 자살 예방을 위한 필수적인 안전성 개선에 집중해왔지만, 우리 테스트 결과 여러 상태에 걸쳐 체계적인 문제가 드러났습니다".​


기업들, 소송 증가 속에서 조사 결과에 이의 제기

이 보고서는 AI 기업들이 자사의 챗봇이 청소년 자살에 기여했다고 주장하는 여러 소송에 직면한 가운데 나왔다. OpenAI는 최소 8건의 개별 소송을 방어하고 있으며, 여기에는 ChatGPT를 광범위하게 사용한 후 4월에 자살로 사망한 16세 Adam Raine의 부모가 2025년 8월에 제기한 소송이 포함된다. Google은 자사가 투자한 스타트업인 Character.AI와 관련하여 10대 사망 사건과 연결된 소송에 직면해 있다.​

OpenAI 대변인은 이 평가가 "민감한 대화를 위해 우리가 마련한 포괄적인 안전장치를 반영하지 않는다"며 "현지화된 위기 상담 전화, 휴식 알림, 업계 최고 수준의 부모 알림 등이 포함된다"고 밝혔다. Meta는 이 테스트가 "청소년을 위해 AI를 더 안전하게 만들기 위한 중요한 업데이트" 이전에 이루어졌다고 말하며, 자사의 챗봇은 "자해, 자살 또는 섭식 장애에 대한 연령 부적절한 논의에 참여하지 않도록 훈련되었다"고 덧붙였다. Google은 "유해한 결과를 방지하기 위해 미성년자를 위한 특정 정책과 안전장치를 마련했다"고 강조했다.​

Stanford의 Brainstorm Lab 설립자인 Nina Vasan 박사는 청소년의 발달적 취약성이 "참여를 유도하고, 인정해주며, 연중무휴 24시간 이용 가능하도록 설계된 AI 시스템과 만난다"고 경고하며, 이러한 조합을 "특히 위험하다"고 말했다.

댓글 0
전체 1,366 / 59 페이지
RobinhoodCEO블라드테네브가공동창업한인공지능스타트업Harmonic이월요일14억5천만달러기업가치로시리즈C펀딩에서1억2천만달러를유치하며,아직상용제품을출시하지않았음에도불구하고유니콘지위를달성했습니다.이번라운드는RibbitCapital이주도했으며,SequoiaCapital,KleinerPerkins,IndexVentures,그리고로렌파월잡스가설립한투자회사인신규투자자EmersonCollective가참여했습니다.​이번펀딩은팔로알토에본사를둔이회사가불과14개월만에진행한세번째자금조달로,총투자금은2억9천5백만달러에이릅니다.Harmonic은인공지능의지속적인문제인할루시네이션(AI시스템이그럴듯하지만잘못된정보를생성하는현상)에집중함으로써투자자들의열광적인관심을받고있습니다.​수학을통한AI환각제거Harmonic의주력모델인Aristotle은정확성을보장하기위해형식적수학검증을사용함으로써기존AI시스템과차별화됩니다.확률적언어예측에의존하는대신,Aristotle은Lean4프로그래밍언어로추론을생성하여각단계의정확성을수학적으로검증할수있게합니다.CEOTudorAchim은Reuters와의인터뷰에서"환각현상의제거는시스템이자연어가아닌코드로추론을출력하도록요구하는우리의요구사항에서직접비롯됩니다"라고말했습니다.​7월,Aristotle은국제수학올림피아드에서금메달수준의성과를달성하며6개문제중5개를해결했습니다.이는Google및OpenAI의시스템과어깨를나란히하는벤치마크였습니다.RibbitCapital의GeneralPartner인NickShalek에따르면,"Aristotle이수학적초지능이현실세계에서달성할수있는것을계속해서입증함에따라우리의파트너십을심화하게되어자랑스럽습니다".​안전필수산업타겟팅Harmonic은항공우주,금융,자동차산업을포함하여오류가심각한결과를초래할수있는분야에서자사의기술을상용화하는것을목표로하고있습니다.현재이회사는Aristotle에대한무료API액세스를제공하고있으며,연구자와수학자들이이도구를사용하여복잡한증명을검증하고발견을가속화하고있습니다.Achim은새로운자금의상당부분이점점더발전된모델을훈련하는데필요한컴퓨팅인프라를지원하는데사용될것이라고밝혔습니다.​형식검증은이미의료기기및항공시스템과같은고위험애플리케이션에서표준으로자리잡고있으며,Harmonic의접근방식은신뢰성우려로인해주저해온위험회피분야에서AI도입을촉진할수있습니다.
553 조회
0 추천
2025.11.26 등록
워너뮤직그룹은화요일AI음악스타트업Suno와합의에도달하여,라이선스파트너십을통해플랫폼이AI생성음악을만드는방식을재정의하게될논쟁적인저작권소송을종결했습니다.이번거래에는Suno가워너로부터콘서트플랫폼Songkick을인수하는것도포함되어있으며,이는음악거대기업이일주일도채안되어이룬두번째주요합의입니다.​소송에서협력으로이번합의는Warner,UniversalMusicGroup,그리고SonyMusicEntertainment가2024년6월Suno와경쟁사Udio를상대로제기한5억달러규모의저작권침해소송중Warner의부분을해결합니다.레이블들은두AI회사가허가나보상없이저작권이있는음원으로음악생성모델을훈련시켰다고비난했습니다.​합의에따라Suno는2026년에현재제공되는서비스를대체할새로운라이선스기반AI모델을출시할예정이며,기존서비스는단계적으로중단됩니다.이파트너십은Warner소속아티스트와작곡가들에게옵트인시스템을통해자신들의이름,이미지,목소리,작곡이AI생성음악에사용될수있는지여부에대한완전한통제권을부여합니다.​WarnerCEORobertKyncl은성명에서"Suno와의이획기적인협약은모두에게이익이되는창작커뮤니티의승리입니다"라고말했습니다."Suno가사용자와수익화측면에서빠르게성장하고있는가운데,우리는수익을확대하고새로운팬경험을제공하는모델을구축할이기회를포착했습니다."​이번거래는Warner의11월19일Udio와의합의및Universal의10월같은회사와의합의에이어이루어졌습니다.Sony는두AI스타트업을상대로여전히소송을진행중인유일한메이저레이블로남아있습니다.​플랫폼변화와산업전환2026년부터Suno는오디오다운로드를위해유료계정을요구할예정이며,무료등급사용자들은자신이만든콘텐츠를플랫폼내에서재생하고공유하는것만가능하게됩니다.유료구독자는월별다운로드제한이있으며,추가다운로드를구매할수있는옵션도제공됩니다.​이합의는Suno가MenloVentures가주도한2억5천만달러규모의시리즈C펀딩라운드를발표한지며칠만에이루어진것으로,이번펀딩으로회사가치는24억5천만달러로평가받았습니다.이번라운드에는Nvidia의벤처부서인NVentures등도참여했습니다.​더넓은협의의일환으로,Suno는Warner의라이브음악발견플랫폼인Songkick을미공개금액에인수했습니다.Warner는2017년에Songkick의앱과브랜드를인수했으며,그후LiveNation이해당티켓팅사업을인수했습니다.
537 조회
0 추천
2025.11.26 등록
일리야수츠케버는**SafeSuperintelligenceInc.**의공동창립자이자전OpenAI수석과학자로서,DwarkeshPatel과의인터뷰에서AI개발이단순히사전학습을대규모로확장하던시대(2020-2025)가한계에도달했으며,이제는"연구의시대"에진입했다고주장한다.그는근본적인과제가모델들이인상적인벤치마크성과에도불구하고"사람보다일반화가현저하게더잘되지않는다"는점이라고설명한다.​수츠케버는현재의강화학습접근법이평가벤치마크에편협하게집중해훈련함으로써의도치않게"보상해킹(rewardhacking)"을하고있을수있다고설명한다.이는마치모델을경쟁프로그래밍대회만을위해10,000시간을연습한학생과비교하는것인데,넓은판단력과취향을가진100시간연습한학생과는다르다는비유로설명한다.이것이모델들이테스트에서는뛰어나지만현실세계의기본적인과제(예:같은두버그사이를번갈아처리하는것)에서는어려움을겪는이유가될수있다.​SSI는2024년9월50억달러가치로10억달러를투자받았으며,2025년3월에는매출없이직원이대략20명임에도불구하고300억달러가치에도달했다.이는여러AI회사들이사전학습확장법칙이점차수익성이감소하고,사용가능한고품질훈련데이터가점점부족해지고있다는증거에직면했기때문이다.
545 조회
0 추천
2025.11.26 등록
Anthropic은화요일에현세대AI모델이미국연간노동생산성성장률을1.8%증가시킬수있다고추정하는연구결과를발표했습니다.이는2019년이후평균성장률을사실상두배로높이는수치입니다.이연구는AI안전기업인Anthropic이발표했으며,Claude챗봇과의실제대화10만건을분석하여기술이광범위하게채택되었을때의잠재적경제영향을계산했습니다.​연구에따르면AI는작업완료시간을평균80%단축시키며,의료지원업무에서는최대90%까지시간절감효과가있었습니다.연구결과에따르면,사람들은일반적으로Claude를복잡한작업에사용하며,이러한작업은인간이수행할경우약1.4시간이소요되고노동비용으로는55달러가듭니다.만약AI가10년내에미국경제전반에완전히확산되고노동이전체생산성의60%를차지한다고가정하면,연구진은전반적인총요소생산성(TFP)이연간1.1%증가할것으로전망했습니다.​"이는전반적인총요소생산성이연1.1%증가한다는것을의미합니다."라고연구자AlexTamkin과PeterMcCrory는썼으며,이는AI가전체경제성장에기여하는정도를근사한다고밝혔습니다.이추정치는최근전망중에서도높은편에해당하며,총요소생산성증가는2000년대초반이후연1%미만에머무는경우가많았습니다.​방법론및한계이연구는AI지원이있을때와없을때작업에소요되는시간을추정하기위해Claude자체를사용하는독특한접근방식을채택했습니다.연구자들은기존임금데이터와작업중요도가중치를사용하여이러한시간절감효과를더넓은경제전반에확대적용했습니다.​이연구는몇가지한계를인정하고있습니다.가장주목할만한점은,AI로절약한시간을근로자들이개인활동이아닌추가적인생산노동에모두사용한다고가정하며,AI결과물을검증하는데소요되는시간을고려하지않는다는것입니다.또한이추정치는AI역량이향후10년간현재수준에머물것이라고가정하여,미래의개선가능성을과소평가할수있습니다.​연구자들은"우리의접근방식은사람들이Claude의결과물을완성된상태로다듬기위해수행해야하는추가작업을고려하지않습니다"라고밝혔습니다.이전의무작위대조시험들은일반적으로더작은시간절감효과를발견했으며,여기에는고객서비스직원의14%생산성향상과전문적인글쓰기작업의40%시간단축이포함됩니다.​더넓은맥락이연구결과는MIT의다론아제모글루(DaronAcemoglu)와같은보수적인경제학자들의추정치와대조를이룬다.아제모글루는AI가향후10년간미국의생산성을0.5%만증가시키고GDP는누적으로약1%증가시킬것으로예측했다.아제모글루는AI가현재경제업무의약5%에만적용된다고주장해왔다.​​연방준비제도부의장필립제퍼슨(PhilipJefferson)은11월에생성형AI를채택한근로자의비율이2024년12월30.1%에서2025년중반까지45.9%로증가했다고언급했다.최근미국노동생산성데이터는2025년2분기에2.4%성장을보였으며,이는2019년이후평균1.8%와비교된다.
540 조회
0 추천
2025.11.26 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입