AI 뉴스

연구들이 AI 훈련 데이터와 테스트의 결함을 드러내다

페이지 정보

작성자 xtalfi
작성일 2025.11.07 14:52
1,117 조회
0 추천
0 비추천

본문

251105-ai-safety-tests-lr-10661e.jpg

(퍼플렉시티가 정리한 기사)


이번 주에 발표된 두 가지 주요 연구는 인공지능 시스템이 구축되고 평가되는 방식의 심각한 약점을 드러내며, AI 능력이 과장되어 왔는지에 대한 의문을 제기하고 있다.

Sony AI는 11월 5일 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 데이터셋인 Fair Human-Centric Image Benchmark를 공개했으며, 옥스퍼드 인터넷 연구소와 영국 정부의 AI 보안 연구소 연구원들은 AI 성능을 측정하는 데 사용되는 테스트의 광범위한 결함을 밝히는 연구를 발표했다. 이러한 연구 결과들은 많은 AI 시스템이 윤리적으로 문제가 있는 데이터로 훈련되고 신뢰할 수 없는 방법으로 평가될 수 있음을 시사한다.​


훈련 데이터에 동의와 다양성이 부족함

Sony AI가 Nature에 발표한 새로운 벤치마크는 연구자들이 컴퓨터 비전 시스템에서 "편향되고 윤리적으로 문제가 있는 학습 데이터의 지속적인 과제"라고 부르는 문제를 다룹니다. 이 데이터셋은 81개국 1,981명의 개인이 찍힌 10,318장의 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받아 수집되었습니다—이는 업계 관행과 크게 다른 방식입니다.​

Sony Group의 AI 거버넌스 글로벌 책임자인 Alice Xiang은 컴퓨터 비전이 객관적이지 않다고 강조했습니다. "컴퓨터 비전은 학습 데이터에 반영된 편향에 따라 사물을 왜곡할 수 있습니다"라고 그녀는 말했습니다. 데이터셋은 기존 AI 모델 중 공정성 테스트를 완전히 통과한 모델이 없다는 것을 보여주었습니다. 일부 모델은 "she/her/hers" 대명사를 사용하는 사람들에 대해 낮은 정확도를 보였으며, 벤치마크는 이를 더 큰 헤어스타일 변동성—이전에 간과되었던 요인—으로 추적했습니다. 직업에 대한 중립적인 질문을 받았을 때, 테스트된 모델들은 특정 인구통계학적 그룹에 대해 특히 고정관념을 강화했으며, 때로는 피사체를 성매매 종사자, 마약상 또는 도둑으로 묘사했습니다.​


벤치마크 테스트가 신뢰할 수 없고 오해의 소지가 있는 것으로 밝혀짐

옥스퍼드 연구팀은 445개 AI 벤치마크를 조사한 결과, 거의 모든 벤치마크에 기술 기업들이 주장하는 결과의 신뢰성을 "약화시키는 결함"이 있음을 발견했습니다. 벤치마크 중 통계적 테스트를 통해 신뢰성을 증명한 것은 16%에 불과했습니다.​

핵심적인 문제는 구성 타당성(construct validity), 즉 테스트가 실제로 그들이 측정한다고 주장하는 것을 제대로 측정하는지에 관한 것입니다. 옥스퍼드 인터넷 연구소의 수석 연구원인 아담 마디(Adam Mahdi)는 NBC 뉴스와의 인터뷰에서, 그레이드 스쿨 매스 8K(Grade School Math 8K) 벤치마크와 같은 테스트에서 모델이 좋은 성과를 거둔다고 해서 반드시 추론 능력을 보여준다고 할 수는 없다고 말했습니다. 그는 "1학년 학생에게 '2 더하기 5가 뭐야?'라고 물었을 때 '7이에요'라고 답하면, 분명 정답입니다. 하지만 이로부터 5학년이 수학적 추론을 완벽하게 습득했다고 결론지을 수 있을까요?"라고 덧붙였습니다.​

이번 연구는 데이터 오염(data contamination)을 주요 문제로 지적했는데, 이는 테스트 문항이 모델의 학습 데이터셋에 포함되어 있어 모델이 답을 추론하는 것이 아니라 암기해서 답을 내는 현상입니다. Mixtral, Phi-3, Gemma를 포함한 여러 모델은 GSM8K 벤치마크와 유사한 신규 문항으로 평가할 때 성능이 최대 13%까지 저하되는 것으로 나타났습니다.​

옥스퍼드 연구의 수석 저자인 앤드루 빈(Andrew Bean)은 업계에서 내놓는 주장들을 그대로 믿어서는 안 된다고 경고했습니다. "모델이 박사 수준의 지능을 가졌다는 것 같은 이야기를 볼 때는 한 번쯤 의심해볼 필요가 있습니다,"라고 빈은 NBC 뉴스에 말했습니다. 이번 연구 결과는 최근 구글이 자사의 Gemma AI 모델이 미국 상원의원에 관한 허위 주장을 생성한 후에 모델을 철회한 상황에서 나왔습니다.

댓글 0
전체 1,366 / 101 페이지
(퍼플렉시티가정리한기사)AI클라우드컴퓨팅스타트업Lambda는화요일시리즈E펀딩에서15억달러이상을유치했다고발표했으며,이는GPU컴퓨팅리소스에대한수요가계속급증함에따라AI인프라부문에서가장큰규모의투자라운드중하나로기록되었다.​이번투자라운드는억만장자투자자ThomasTull과MarkWalter가이끄는지주회사TWGGlobal이주도했으며,Tull의USInnovativeTechnologyFund도참여했다.이번자본유치를통해Lambda는수천대의NvidiaGPU를갖춘자체데이터센터구축을가속화할수있게되었으며,AI학습및추론역량에대한증가하는수요를활용할수있는입지를확보하게되었다.​인프라붐속에서의급속한확장Lambda는여러방면에서공격적인확장전략을실행하면서이번자금을확보했습니다.이달초,회사는과수만대의NvidiaGPU(첨단GB300NVL72시스템포함)로구동되는AI인프라를배치하기위한수십억달러규모의계약을발표했습니다.Lambda는또한PrimeDataCenters와파트너십을맺고남부캘리포니아에GPU클러스터를배치하고미주리주캔자스시티에5억달러규모의AI팩토리를설립할계획을밝혔습니다.​Lambda의CEO인StephenBalaban은"Microsoft와8년이상협력해왔으며,이번은우리관계에서놀라운다음단계입니다"라고말했습니다.2012년에설립된이회사는장기약정없이고성능컴퓨팅에대한유연한액세스를원하는개발자및기업을대상으로"초지능클라우드(TheSuperintelligenceCloud)"로자리매김했습니다.​Lambda는CoreWeave,TogetherAI및주요클라우드제공업체와함께점점더경쟁이치열해지는시장에서경쟁하고있습니다.CoreWeave는2025년3월230억달러의가치평가로상장했으며최근556억달러의계약잔고를보고했습니다.2024년261억8천만달러규모로평가된글로벌AI인프라시장은2034년까지2,214억달러에달할것으로예상되며,연평균23.8%의성장률을보일것으로전망됩니다.​성장을위한전략적포지셔닝시리즈E는Lambda의2025년2월4억8천만달러규모의시리즈D라운드에이어진행되었으며,당시회사가치는25억달러로평가되었습니다.업계소식통에따르면Lambda는2025년5월까지연간매출5억500만달러를달성했으며,이는2024년말4억2천5백만달러에서증가한수치입니다.또한회사는MacquarieGroup으로부터5억달러규모의대출과로부터2억7천5백만달러의신용한도를포함한상당한부채금융을확보했으며,이는특히Nvidia칩구매를위한것입니다.​Lambda는유연한가격책정과함께온디맨드GPU액세스를제공함으로써차별화되며,다년계약을선호하지않는연구자와스타트업에게어필하고있습니다.회사는데이터센터전반에걸쳐100만개이상의NvidiaGPU를운영하고있습니다.
918 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)유럽연합집행위원회는수요일에디지털옴니버스패키지를공개할예정이며,이는지난10년간세계에서가장공격적인기술규제기관으로서의EU의입장에서극적인전환을의미합니다.이광범위한입법제안은일반데이터보호규정(GDPR)의핵심조항을수정하고,AI법의주요조항을연기하며,개인정보보호옹호자들이유럽연합역사상디지털권리의가장큰후퇴를나타낼수있다고경고하는변화를도입할것입니다.​집행위원회가EU경쟁력을높이기위해필요한"단순화"라고설명하는이패키지는개인데이터의정의를축소하고,민감한정보를사용한AI훈련에대한제한을완화하며,주요플랫폼의손에통제권을집중시킬수있는브라우저수준의동의설정을잠재적으로허용할것입니다.뉴욕타임즈가검토한유출된초안에따르면,광고ID및쿠키와같은가명식별자는더이상GDPR보호대상인개인데이터로분류되지않을수있습니다.​경쟁력우려가규제완화를주도하다이정책역전은유럽기업들의압력증가와마리오드라기전이탈리아총리의2024년9월경쟁력보고서의권고에따른것으로,해당보고서는급진적인개혁없이는EU가"느린고통"에직면할것이라고경고했다.우르줄라폰데어라이엔집행위원장은미국및중국과의혁신격차를줄이기위해"단순화"와"규제완화"모두를명시적으로지지했으며,간소화가핵심보호조치를약화시키지않을것이라는이전의보장을철회했다.​초안은기업이명시적인사용자동의없이건강상태및정치적견해와같은민감한범주를포함한개인데이터를AI시스템훈련에사용할수있는새로운법적근거를마련할것이다.또한고위험AI시스템에벌금이적용되기전1년의유예기간을도입하고투명성위반에대한처벌을2027년8월까지연기할예정이다.​시민사회,'천번의상처로인한죽음'경고127개의시민사회단체와노동조합연합은이제안들을유럽의디지털보호장치를은밀히해체하는것이라고규탄했습니다.활동가막스슈렘스가이끄는오스트리아프라이버시단체noyb는이러한변화를"천번의칼질로인한죽음"이라고묘사하며,이것이유럽의중소기업보다는OpenAI,Google,Meta,Amazon,Microsoft와같은수조달러규모의기업들에게주로이익이된다고주장했습니다.​이제안들은또한개인이자신의데이터에접근하고,수정하거나,삭제할수있는권리를행사할수있는경우를제한하여,그러한요청을"데이터보호목적"으로만한정할것입니다.비평가들은이러한변화가근로자,언론인,소비자들이법적분쟁에서데이터요청을사용하는것을차단할수있다고말합니다.출판사들과소규모광고기술회사들은브라우저수준의프라이버시통제가지배적인플랫폼의권력을더욱공고히하여"Apple의AppTrackingTransparency보다더나쁜"역학을만들수있다는우려를제기했습니다.
851 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)이스라엘경제뉴스매체글로브스에따르면셰바메디컬센터의ARC이노베이션과마운트시나이아이칸의과대학은월요일NVIDIA와의파트너십을발표했다.이파트너십은아직충분히이해되지않은인간유전체의대다수를해독하는것을목표로한다고밝혔다.이번협업은대형언어모델기술을활용해단백질을암호화하지않는98%이상의DNA를해독하고,이를통해질병예방,진단및치료를위한새로운경로를열수있을것으로기대된다.​이이니셔티브에는수천만달러규모의투자가이루어지며,세파트너기관모두각각5~7명의인력을전담하여프로젝트에투입할예정이다.NVIDIA는컴퓨팅파워,인프라,알고리즘및AI팀을지원하고,셰바메디컬센터는임상데이터를제공하며,마운트시나이측은현재진행중인MillionHealthDiscoveriesProgram의일환으로11,000명의유전체정보를제공할계획이다.​유전체의"암흑물질"을표적으로삼기2000년에최초의인간게놈이시퀀싱되었지만,과학자들은단백질을암호화하는유전자가인간DNA의약1~2퍼센트만을차지한다는사실을곧발견했습니다.나머지98퍼센트는한때"쓰레기DNA"로치부되었으나,이제는유전자발현을조절하고암,심장병,자폐증등과같은질병에서중요한역할을하는핵심적인조절요소들이포함된것으로이해되고있습니다.​Sheba를대표해프로젝트를이끄는과학책임자인GidiRechavi교수는,98퍼센트가넘는유전자가"아주정밀하고섬세하게단백질을발현하는유전자들을조절하는역할을하는복잡한유전자오케스트라의일부로기능한다"고설명했습니다.현재프로젝트는이러한유전자들의활동을건강한사람부터먼저점진적으로해독한뒤,일반적인질병뿐만아니라결국모든건강과질병영역에서해독하는것을목표로하고있습니다.​지적재산권및접근성협업을통해창출된모든지적재산권은Sheba와MountSinai의소유로남게되며,AI모델자체는퍼블릭도메인에속하게됩니다.하지만두병원은이모델에대해초기및독점적인접근권한을가지게된다고Sheba의료센터의총괄이사인YitshakKreiss교수는밝혔습니다.두병원은이프로젝트를성공적으로평가하기위해약2년내에질병경로에대해새로운사실을학습할수있을경우를기준으로삼을것입니다.
914 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)암스테르담지역의식품기술스타트업AKAFoods가식품제품개발을가속화하는데특화된세계최초의안전한AI플랫폼을출시하기위해1,720만달러규모의시드펀딩라운드를마감했다고이번주에발표했습니다.​AI분야의저명한연구자인Alex와MichaelBronstein이주도한이번투자는AKAStudio의공식데뷔를알립니다.AKAStudio는수년이걸리는제품개발일정을몇주로단축하면서도엄격한데이터보안프로토콜을유지하도록설계된독점시스템입니다.이플랫폼은기업의내부연구개발데이터,원료사양,규제문서,감각평가를하나의통합된디지털프레임워크로통합하여AI어시스턴트가이를분석해포뮬레이션결정을안내할수있도록합니다.​산업의병목현상공략암스테르담에본사를둔이회사는창립자겸CEO인데이비드삭이말한식품산업이방대한조직지식을효과적으로활용하는데겪고있는어려움을해결하기위해노력하고있습니다."AKA스튜디오는기업들이그지식을안전하게포착하고,조직하고,적용할수있는능력을제공합니다,"라고삭은말했습니다.또한이번투자를통해글로벌엔터프라이즈배포와플랫폼기반과학의지속적인발전이가능해졌다고덧붙였습니다.​일반적인AI모델과달리AKA스튜디오는전용감각연구시설에서비롯된질감,향,맛과관련된실험및분석측정값을통합합니다.최고과학자이자투자자인알렉스브론스타인교수는플랫폼의특화된역량을강조하며,"AKAFoods는본질적으로새로운유형의문법,즉식품을위한언어를시장에선보이고있으며,AI에이전트가다양한외부데이터소스에연결되어레시피를어떻게개선할수있을지추천할수있도록합니다.이것은챗GPT와같은일반적인AI모델로는절대달성할수없는일입니다".​​이플랫폼은클린라벨재구성,설탕과지방감축,공급망회복력등주요산업과제를해결하는데초점을맞추고있습니다.보안은시스템설계의핵심요소이며,플랫폼은소프트웨어-서비스형(SaaS)솔루션으로각고객에게독립된데이터환경을제공합니다.보안요구가높은조직의경우,온프레미스에어갭구성으로배포할수있습니다.회사는고객데이터가절대외부모델학습에공유되거나포함되지않는다는점을보장합니다.​회사에따르면,기반이되는센서리-AI프레임워크는향후식품을넘어향료,향수,화장품,의약품등다양한분야에서응용될잠재력을갖추고있습니다.
853 조회
0 추천
2025.11.19 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입