AI 뉴스

연구들이 AI 훈련 데이터와 테스트의 결함을 드러내다

페이지 정보

작성자 xtalfi
작성일 2025.11.07 14:52
1,136 조회
0 추천
0 비추천

본문

251105-ai-safety-tests-lr-10661e.jpg

(퍼플렉시티가 정리한 기사)


이번 주에 발표된 두 가지 주요 연구는 인공지능 시스템이 구축되고 평가되는 방식의 심각한 약점을 드러내며, AI 능력이 과장되어 왔는지에 대한 의문을 제기하고 있다.

Sony AI는 11월 5일 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 데이터셋인 Fair Human-Centric Image Benchmark를 공개했으며, 옥스퍼드 인터넷 연구소와 영국 정부의 AI 보안 연구소 연구원들은 AI 성능을 측정하는 데 사용되는 테스트의 광범위한 결함을 밝히는 연구를 발표했다. 이러한 연구 결과들은 많은 AI 시스템이 윤리적으로 문제가 있는 데이터로 훈련되고 신뢰할 수 없는 방법으로 평가될 수 있음을 시사한다.​


훈련 데이터에 동의와 다양성이 부족함

Sony AI가 Nature에 발표한 새로운 벤치마크는 연구자들이 컴퓨터 비전 시스템에서 "편향되고 윤리적으로 문제가 있는 학습 데이터의 지속적인 과제"라고 부르는 문제를 다룹니다. 이 데이터셋은 81개국 1,981명의 개인이 찍힌 10,318장의 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받아 수집되었습니다—이는 업계 관행과 크게 다른 방식입니다.​

Sony Group의 AI 거버넌스 글로벌 책임자인 Alice Xiang은 컴퓨터 비전이 객관적이지 않다고 강조했습니다. "컴퓨터 비전은 학습 데이터에 반영된 편향에 따라 사물을 왜곡할 수 있습니다"라고 그녀는 말했습니다. 데이터셋은 기존 AI 모델 중 공정성 테스트를 완전히 통과한 모델이 없다는 것을 보여주었습니다. 일부 모델은 "she/her/hers" 대명사를 사용하는 사람들에 대해 낮은 정확도를 보였으며, 벤치마크는 이를 더 큰 헤어스타일 변동성—이전에 간과되었던 요인—으로 추적했습니다. 직업에 대한 중립적인 질문을 받았을 때, 테스트된 모델들은 특정 인구통계학적 그룹에 대해 특히 고정관념을 강화했으며, 때로는 피사체를 성매매 종사자, 마약상 또는 도둑으로 묘사했습니다.​


벤치마크 테스트가 신뢰할 수 없고 오해의 소지가 있는 것으로 밝혀짐

옥스퍼드 연구팀은 445개 AI 벤치마크를 조사한 결과, 거의 모든 벤치마크에 기술 기업들이 주장하는 결과의 신뢰성을 "약화시키는 결함"이 있음을 발견했습니다. 벤치마크 중 통계적 테스트를 통해 신뢰성을 증명한 것은 16%에 불과했습니다.​

핵심적인 문제는 구성 타당성(construct validity), 즉 테스트가 실제로 그들이 측정한다고 주장하는 것을 제대로 측정하는지에 관한 것입니다. 옥스퍼드 인터넷 연구소의 수석 연구원인 아담 마디(Adam Mahdi)는 NBC 뉴스와의 인터뷰에서, 그레이드 스쿨 매스 8K(Grade School Math 8K) 벤치마크와 같은 테스트에서 모델이 좋은 성과를 거둔다고 해서 반드시 추론 능력을 보여준다고 할 수는 없다고 말했습니다. 그는 "1학년 학생에게 '2 더하기 5가 뭐야?'라고 물었을 때 '7이에요'라고 답하면, 분명 정답입니다. 하지만 이로부터 5학년이 수학적 추론을 완벽하게 습득했다고 결론지을 수 있을까요?"라고 덧붙였습니다.​

이번 연구는 데이터 오염(data contamination)을 주요 문제로 지적했는데, 이는 테스트 문항이 모델의 학습 데이터셋에 포함되어 있어 모델이 답을 추론하는 것이 아니라 암기해서 답을 내는 현상입니다. Mixtral, Phi-3, Gemma를 포함한 여러 모델은 GSM8K 벤치마크와 유사한 신규 문항으로 평가할 때 성능이 최대 13%까지 저하되는 것으로 나타났습니다.​

옥스퍼드 연구의 수석 저자인 앤드루 빈(Andrew Bean)은 업계에서 내놓는 주장들을 그대로 믿어서는 안 된다고 경고했습니다. "모델이 박사 수준의 지능을 가졌다는 것 같은 이야기를 볼 때는 한 번쯤 의심해볼 필요가 있습니다,"라고 빈은 NBC 뉴스에 말했습니다. 이번 연구 결과는 최근 구글이 자사의 Gemma AI 모델이 미국 상원의원에 관한 허위 주장을 생성한 후에 모델을 철회한 상황에서 나왔습니다.

댓글 0
전체 1,366 / 181 페이지
(퍼플렉시티가정리한기사)Google는2025년11월3일플로리다주립대학교및아칸소주와새로운교육파트너십을발표하여,전국의학생과근로자들에게무료AI기반교육을제공하는AIforEducationAccelerator프로그램을확대했습니다.플로리다주립대학교는GooglePeopleManagementEssentials인증프로그램을제공하는전국최초의교육기관중하나가되었으며,이는Gemini및NotebookLM과같은AI도구를사용하여리더십기술을가르치도록설계된8시간분량의자기주도학습과정입니다.Google의SchoolforLeaders가개발한이프로그램은SMART목표설정,프로젝트계획개발,커뮤니케이션맞춤화를포함한관리업무를위한인공지능실습경험을제공합니다.​대학들이AI교육통합에박차를가하다"우리는세계에서가장저명한기술기업중하나인Google과의파트너십과그것이우리학생들에게제공할혜택에대해기쁘게생각합니다"라고FSU경영대학학장MichaelD.Hartline이말했다.이대학교는플로리다에서Google의교육용AI가속기프로그램에참여하는유일한R1연구기관으로선정되었다.​동시에아칸소주는주상무부를통해Google과의파트너십을발표하여수요가높은기술분야의온라인직업훈련프로그램에대한무료액세스를제공한다고밝혔다.이이니셔티브에는GoogleAIEssentials와GooglePromptingEssentials를다루는새로운5시간분량의AI모듈이포함되어있으며,참가자들에게책임감있는AI관행과생성도구를위한효과적인프롬프트설계를가르친다.​18세이상의아칸소주민들은주의인력훈련네트워크를통해사이버보안,데이터분석,IT지원,디지털마케팅,프로젝트관리및사용자경험디자인분야의자격증을무료로취득할수있다.이파트너십은올해초발표된Google의웨스트멤피스40억달러규모데이터센터투자에이어이루어졌다.​디지털역량확대이니셔티브유사한파트너십이여러주에걸쳐나타나고있으며,오클라호마,테네시,메릴랜드,노스캐롤라이나가대학시스템과인력센터를통해비슷한프로그램을시작했습니다.이러한협력은2025년8월에발표된구글의10억달러규모AI교육투자약속을반영하며,이미100개이상의대학들이AIforEducationAccelerator프로그램에참여하고있습니다.​"구글에서우리는관리자에대한투자가모든사람을위한보다효과적이고협력적이며지원적인환경을조성하고비즈니스성과를이끌어낸다는것을직접경험했습니다"라고구글의최고학습책임자인브라이언글레이저는말했습니다.구글은학생들이최초의"AI네이티브"세대가되는동시에AI주도경제를위한인력준비의선두주자로자리매김하고있습니다.​11월발표는교육기관들이점점더경쟁이치열해지는취업시장에서기술중심직업을위해학생과근로자를준비시키기위해AI교육프로그램의도입이가속화되고있음을보여줍니다.
1217 조회
0 추천
2025.11.04 등록
(퍼플렉시티가정리한기사)애플이전화및페이스타임앱'실시간번역'기능이한국어,중국어(간체및번체),일본어를새롭게지원한다고4일밝혔다.이로써서로다른언어를사용하는사용자들이에어팟을통해자연스럽게소통할수있게됐다.​에어팟모델별지원및기능에어팟프로3,에어팟프로2,에어팟4액티브노이즈캔슬링(ANC)모델에서실시간번역기능을베타버전으로이용할수있다.이기능은애플인텔리전스및첨단컴퓨테이셔널오디오기술로구동된다.​에어팟사용자가말을하면상대방의언어로즉시번역되며,상대방의답변또한사용자의선호언어로실시간번역되어들려준다.두사람모두아이폰에서실시간번역을활성화하면ANC기능이상대의음성을줄여번역에집중하면서도자연스러운대화를유지할수있다.​앱별활용범위확대실시간번역기능은메시지,전화,페이스타임앱에서도사용할수있다.메시지앱에서는사용자가입력중인답장이자동으로번역되어상대방의언어로전송된다.전화앱에서는통화내용을번역된음성으로듣거나화면에서전사문형태로확인할수있으며,페이스타임에서는상대의목소리를들으며동시에번역된실시간자막을볼수있다.​에어팟을착용하지않은상대와대화할때는아이폰화면을통해번역된전사문을실시간으로확인할수있어언어가다른사용자간에도원활한의사소통이가능하다.모든실시간번역과정은온디바이스방식으로처리되어사용자의사적인대화내용이보호된다.
1148 조회
0 추천
2025.11.04 등록
(퍼플렉시티가정리한기사)유럽위원회는오늘코펜하겐에서열린유럽AI과학정상회의에서유럽인공지능과학자원(RAISE)을공식출범시켰으며,이는EU가AI기반과학연구분야의글로벌리더로자리매김하려는노력에서중요한진전을의미합니다.​헤나비르쿠넨(HennaVirkkunen)집행부위원장과에카테리나자하리에바(EkaterinaZaharieva)집행위원은가상연구소의시범프로그램을공개했으며,이프로그램은호라이즌유럽프로그램하에서1억700만유로의초기자금을지원받게됩니다.이번출범식은유럽위원회와EU이사회덴마크의장국이주최한이틀간의정상회의기간동안개최되었습니다.​유럽자원을통합하기위한가상연구소RAISE는ApplyAI전략과유럽과학인공지능전략의주력사업을대표합니다.이가상연구소는암치료개선부터환경문제해결및지진영향예측개선에이르기까지,AI를개발하고이를적용하여혁신적인과학적돌파구를이끌어내는데필요한핵심자원들을한데모으는것을목표로합니다.​자하리에바집행위원은10월에"과학분야AI전략을통해유럽은최첨단을유지하기위한결정적인조치를취하고있습니다"라고말했습니다."우리는연구자,스타트업,중소기업들에게아이디어를돌파구로전환할수있는도구를제공하여경쟁력을높이고실험실에서시장으로의전환을가속화할것입니다.RAISE는자원을통합하고,투자를동원하며,유럽전역과그너머에서최고의인재를유치하는촉매제가될것입니다".​이사업은데이터,인프라,인재,연구자금이라는네가지핵심영역에걸쳐AI자원을조정할것입니다.RAISE는EU연구자와스타트업들에게AI기가팩토리에대한전용접근을제공할예정이며,집행위원회는호라이즌유럽으로부터최대6억유로의투자를계획하고있습니다.​​야심찬자금조달계획유럽위원회는야심찬자금지원목표를설정하여HorizonEurope의AI연간투자를30억유로이상으로두배로늘릴계획입니다.이전략은또한"ChooseEurope"접근법을통해글로벌과학인재를유치하는것을목표로합니다.​RAISE는단계적으로시행될예정이며,이번달1억800만유로의EU자금지원을받아시범사업을시작합니다.2단계는2028년까지예상되지않습니다.이이니셔티브는또한다른EU프로그램,EU회원국정부및민간부문으로부터지원을확보할것입니다.​이번정상회의는과학,산업및정책커뮤니티에서약900명의참가자를한자리에모읍니다.행사는다양한과학분야에대한AI의영향과투자및정책지원을동원하기위한전략을탐구하는병렬주제별워크숍트랙을특징으로합니다.
1172 조회
0 추천
2025.11.04 등록
(퍼플렉시티가정리한기사)전OpenAI수석과학자일리야서츠케버는폭발적인법정증언에서2023년11월CEO샘알트먼을해고한지24시간만에회사이사회가경쟁사Anthropic과의합병을모색했으며,실질적인장애물로인해논의가무산되기전까지AI업계전체판도를재편할수있었다고밝혔다.법적분쟁에서드러난비밀합병협상놀라운폭로는ElonMusk의OpenAI를상대로한진행중인소송에서Sutskever의10시간증언에서나왔습니다.이번주에공개된증언에따르면,이사회멤버HelenToner는2023년11월18일-Altman의갑작스러운해임바로하루후-Anthropic에연락하거나Anthropic으로부터연락을받았습니다.​"그들은OpenAI와합병하여리더십을인수하겠다는제안을가지고연락해왔습니다"라고Sutskever는증언했으며,CEODarioAmodei와사장DanielaAmodei를포함한Anthropic의리더십팀과이사회멤버들간의통화를설명했습니다.이제안은Anthropic의경영진이통합된조직을통제하도록하여,가장저명한두AI연구조직을통합하는것이었습니다.​합병에반대했던Sutskever는"그것에대해매우불만족스러웠다"고증언하며"OpenAI가Anthropic과합병하는것을정말원하지않았다"고말했습니다.그러나다른이사회멤버들은이급진적인구조조정에호의적인것으로보였으며,Toner는제안에"가장지지적인"인물로나타났습니다."그들은훨씬더지지적이었습니다,네"라고Sutskever는말하며,"최소한반대하는사람은아무도없었습니다"라고언급했습니다.​AI를영원히바꿀뻔한위기합병논의는오픈AI가가장혼란스러웠던시기에일어났으며,이는이사회가알트만의리더십에대한신뢰상실을이유로그를해임하기로결정한직후였다.2023년11월17일알트만해임을주도한이사회멤버는수츠케버,토너,타샤맥컬리,아담디앤젤로등이었다.​그러나협상은앤스로픽측이제안의진전을막는구체적이지않은"실질적장애물"을제기하며얼마지나지않아무산됐다.한편,직원들의거센반발도빠르게커졌다.오픈AI전체약770명직원중700명이상이이사회가결정을번복하지않으면대규모로사직하겠다는내용의서한에서명했다.직원,투자자,주요파트너인마이크로소프트의강력한압박속에,이사회는해임5일만인11월22일알트만을복귀시켰다.​제안된합병에는특별한아이러니가있다.앤스로픽은2021년,아모데이남매와약12명의AI안전문제로떠난전오픈AI연구자들이모여설립한스핀오프기업이기때문이다.이후이회사는2025년9월130억달러의자금을조달하며기업가치를세배가까이늘려1,830억달러에달했으며,헌법적AI접근법을강조하는더신중한대안으로자리매김하고있다.​법적분쟁이더깊은갈등을드러내다이증언은OpenAI가비영리사명을배신했다고주장하는머스크의소송의일부를구성하며,서츠케버의증언에서는그가알트먼의"지속적인거짓말과조작패턴"이라고부른것을기록한52페이지분량의메모도공개되었습니다.이러한폭로는머스크와알트먼사이의공개적인긴장을다시불러일으켰으며,두사람은주말동안소셜미디어플랫폼X에서서로를비난했습니다.​"당신은비영리단체를훔쳤다"고머스크가게시했고,알트먼은"당신이죽은것으로내버려둔것을역대최대비영리단체가되어야할것으로만드는데도움을줬다"고반격했습니다.머스크는서츠케버의증언을"52페이지에담긴이야기"라고언급하며,OpenAI의비영리에서영리구조로의전환을둘러싼현재진행중인법적분쟁을강조했습니다.​최근2차주식매각이후5,000억달러의가치로평가받고있는OpenAI는지난달공익법인으로의구조조정을완료했습니다.한편,서츠케버는2024년5월OpenAI를떠나SafeSuperintelligence를설립했으며,이회사는수익이전혀없음에도불구하고10억달러이상을유치하여320억달러의가치평가를받았습니다.
1310 조회
0 추천
2025.11.04 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입