AI 뉴스

연구들이 AI 훈련 데이터와 테스트의 결함을 드러내다

페이지 정보

작성자 xtalfi
작성일 2025.11.07 14:52
1,095 조회
0 추천
0 비추천

본문

251105-ai-safety-tests-lr-10661e.jpg

(퍼플렉시티가 정리한 기사)


이번 주에 발표된 두 가지 주요 연구는 인공지능 시스템이 구축되고 평가되는 방식의 심각한 약점을 드러내며, AI 능력이 과장되어 왔는지에 대한 의문을 제기하고 있다.

Sony AI는 11월 5일 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 데이터셋인 Fair Human-Centric Image Benchmark를 공개했으며, 옥스퍼드 인터넷 연구소와 영국 정부의 AI 보안 연구소 연구원들은 AI 성능을 측정하는 데 사용되는 테스트의 광범위한 결함을 밝히는 연구를 발표했다. 이러한 연구 결과들은 많은 AI 시스템이 윤리적으로 문제가 있는 데이터로 훈련되고 신뢰할 수 없는 방법으로 평가될 수 있음을 시사한다.​


훈련 데이터에 동의와 다양성이 부족함

Sony AI가 Nature에 발표한 새로운 벤치마크는 연구자들이 컴퓨터 비전 시스템에서 "편향되고 윤리적으로 문제가 있는 학습 데이터의 지속적인 과제"라고 부르는 문제를 다룹니다. 이 데이터셋은 81개국 1,981명의 개인이 찍힌 10,318장의 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받아 수집되었습니다—이는 업계 관행과 크게 다른 방식입니다.​

Sony Group의 AI 거버넌스 글로벌 책임자인 Alice Xiang은 컴퓨터 비전이 객관적이지 않다고 강조했습니다. "컴퓨터 비전은 학습 데이터에 반영된 편향에 따라 사물을 왜곡할 수 있습니다"라고 그녀는 말했습니다. 데이터셋은 기존 AI 모델 중 공정성 테스트를 완전히 통과한 모델이 없다는 것을 보여주었습니다. 일부 모델은 "she/her/hers" 대명사를 사용하는 사람들에 대해 낮은 정확도를 보였으며, 벤치마크는 이를 더 큰 헤어스타일 변동성—이전에 간과되었던 요인—으로 추적했습니다. 직업에 대한 중립적인 질문을 받았을 때, 테스트된 모델들은 특정 인구통계학적 그룹에 대해 특히 고정관념을 강화했으며, 때로는 피사체를 성매매 종사자, 마약상 또는 도둑으로 묘사했습니다.​


벤치마크 테스트가 신뢰할 수 없고 오해의 소지가 있는 것으로 밝혀짐

옥스퍼드 연구팀은 445개 AI 벤치마크를 조사한 결과, 거의 모든 벤치마크에 기술 기업들이 주장하는 결과의 신뢰성을 "약화시키는 결함"이 있음을 발견했습니다. 벤치마크 중 통계적 테스트를 통해 신뢰성을 증명한 것은 16%에 불과했습니다.​

핵심적인 문제는 구성 타당성(construct validity), 즉 테스트가 실제로 그들이 측정한다고 주장하는 것을 제대로 측정하는지에 관한 것입니다. 옥스퍼드 인터넷 연구소의 수석 연구원인 아담 마디(Adam Mahdi)는 NBC 뉴스와의 인터뷰에서, 그레이드 스쿨 매스 8K(Grade School Math 8K) 벤치마크와 같은 테스트에서 모델이 좋은 성과를 거둔다고 해서 반드시 추론 능력을 보여준다고 할 수는 없다고 말했습니다. 그는 "1학년 학생에게 '2 더하기 5가 뭐야?'라고 물었을 때 '7이에요'라고 답하면, 분명 정답입니다. 하지만 이로부터 5학년이 수학적 추론을 완벽하게 습득했다고 결론지을 수 있을까요?"라고 덧붙였습니다.​

이번 연구는 데이터 오염(data contamination)을 주요 문제로 지적했는데, 이는 테스트 문항이 모델의 학습 데이터셋에 포함되어 있어 모델이 답을 추론하는 것이 아니라 암기해서 답을 내는 현상입니다. Mixtral, Phi-3, Gemma를 포함한 여러 모델은 GSM8K 벤치마크와 유사한 신규 문항으로 평가할 때 성능이 최대 13%까지 저하되는 것으로 나타났습니다.​

옥스퍼드 연구의 수석 저자인 앤드루 빈(Andrew Bean)은 업계에서 내놓는 주장들을 그대로 믿어서는 안 된다고 경고했습니다. "모델이 박사 수준의 지능을 가졌다는 것 같은 이야기를 볼 때는 한 번쯤 의심해볼 필요가 있습니다,"라고 빈은 NBC 뉴스에 말했습니다. 이번 연구 결과는 최근 구글이 자사의 Gemma AI 모델이 미국 상원의원에 관한 허위 주장을 생성한 후에 모델을 철회한 상황에서 나왔습니다.

댓글 0
전체 1,366 / 109 페이지
(퍼플렉시티가정리한기사)서울에본사를둔BoneAI는인공지능기반방위로보틱스를구축하기위해1,200만달러의시드펀딩을확보했으며,690억달러규모의아시아방산기성산업에도전하는신생아시아방산기술스타트업물결에합류했다.​뉴욕벤처회사ThirdPrime이주도하고한국산업대기업코오롱그룹의전략적투자가참여한이번라운드는,기존제조업체들이지배하는지역에서방산혁신에대한이례적인투자를나타낸다.이전에위조방지스타트업MarqVision을공동창립한BoneAI창립자DKLee는이번라운드에150만달러를개인적으로투자했으며,이는전체투자액의10퍼센트이상을차지한다.​아시아방위산업거대기업들과의경쟁서울과팔로알토에기반을둔이스타트업은국방및정부고객을위해자율드론,지상차량,해양시스템을개발하고있으며,초기에는물류지원,산불감지,안티드론방어를위한항공드론에집중하고있습니다.운영첫해에본(Bone)은300만달러의매출을올렸고,7자리수의정부계약을확보했다고테크크런치는전했습니다.​이대표(Lee)는출시6개월만에한국드론제조업체D-Makers를인수해회사의하드웨어지식재산권을본의AI플랫폼에즉시통합함으로써회사의성장을가속화했습니다.이스타트업은자율주행차량을도입하는한국정부주도의종단간(end-to-end)물류프로그램에선정되었습니다.​이번투자는2024년말기준국내방산대기업들의주문잔고가약690억달러에이르는가운데이뤄졌으나,2024년11월유럽연합-한국안보및방위파트너십체결이후서울이유럽나토회원국들의두번째로큰무기공급국이됐음에도불구하고한국의방산테크스타트업생태계는여전히미흡한실정입니다.미국의방산테크기업안듀릴(Anduril)은305억달러의기업가치를기록했고,유럽의헬싱(Helsing)은120억유로(138억달러)에달하지만,아시아에서는이와견줄만한기업이아직나오지않았습니다.​“아시아는아직동일한수준의채택을보지못했습니다.”라고ThirdPrime의제너럴파트너마이클킴(MichaelKim)은말하며,본이“주권AI,다극화,재산업화의교차점”에위치하고있다고강조했습니다.킴은“한국의고품질,비용경쟁력있는하드웨어제조산업”과본의인수전략이결합한다면“제품성숙도와상업적성과를더욱가속화할수있을것”이라고언급했습니다
868 조회
0 추천
2025.11.18 등록
(퍼플렉시티가정리한기사)폴매카트니경은영국저작권법개정안에항의하는앨범*IsThisWhatWeWant?*의바이닐에디션에거의무음에가까운트랙을기여했습니다.이개정안은인공지능기업들이아티스트의작품에대한허가나대가지불없이자사모델을훈련시킬수있도록허용하는내용을담고있습니다.​83세의비틀즈전설은12월8일앨범의바이닐발매를위해주로배경잡음과낮은불분명한소음으로구성된2분45초길이의트랙—빈스튜디오의녹음—을녹음했습니다.전StabilityAI임원에드뉴턴-렉스가기획한이프로젝트에는케이트부시,데이먼알반,한스짐머,애니레녹스를포함한1,000명이상의음악가들이참여했으며,모든수익금은자선단체HelpMusicians에기부됩니다.​정부제안이광범위한반대에직면하다키어스타머총리가이끄는영국정부는처음에창작자가적극적으로자신의작품을차단하지않는한AI개발자가저작권이있는자료를훈련에사용할수있도록허용하는"옵트아웃"시스템을제안했다.2025년2월에종료된이협의는13,000건이넘는응답을받았다.큰반발에직면한정부는이후옵트아웃제안이더이상선호하는옵션이아니라고밝혔지만,대안을제시하지는않았다.​동의없이저작권이있는자료를사용하는것에대한윤리적우려로2023년StabilityAI를사임한뉴턴-렉스는"정부는국가음악인들의일생의작업을AI기업에무료로넘기지않겠다고약속해야한다"고말했다."그렇게하는것은우리의세계최고수준의창작산업에막대한피해를입힐것이며,전혀불필요하고해외거대기술기업에만이익이될뿐이다."​침묵의앨범차트,논쟁을불러일으키다이앨범의12개디지털트랙은제목을통해"영국정부는AI기업을위해음악도용을합법화해서는안된다(TheBritishGovernmentMustNotLegaliseMusicTheftToBenefitAICompanies)"라는메시지를전달하며,2025년2월발매당시영국앨범차트38위에올랐다.Thestate51Conspiracy레이블에서발매한바이닐에디션에는McCartney의보너스트랙이포함되어있으며1,000장의넘버링카피로한정되었다.​비평가들은옵트아웃시스템이아티스트들에게불가능한부담을지우고근본적인저작권원칙을뒤집는다고주장한다.5월에McCartney는SirEltonJohn,DuaLipa,Coldplay를포함한400명이상의영국음악가들과함께더강력한저작권보호를촉구하는공개서한에서명했다.영국의창작산업은연간약1,250억파운드를경제에기여하고있으며,주요미국기술기업들은영국에300억파운드이상의투자를발표했다.​
904 조회
0 추천
2025.11.18 등록
(퍼플렉시티가정리한기사)Ceva는2025년11월17일,자사의NeuPro-Nano저전력신경처리장치가IoTEvolutionWorld로부터2025IoT엣지컴퓨팅우수상을수상했다고발표했으며,이는디바이스에서직접실시간인텔리전스를가능하게하는엣지AI기술에대한업계의증가하는관심을강조합니다.이상은클라우드연결에의존하지않고IoT디바이스에실시간컴퓨팅,데이터가용성및머신러닝을제공하는엣지솔루션을제공하는기업을인정합니다.​NeuPro-NanoNPU제품군은초저전력엣지AI추론을위해특별히설계되었으며,지연시간,프라이버시및신뢰성이중요한디바이스내에서직접인텔리전스를가능하게합니다.Ceva에따르면,이기술은이미여러대량생산소비자및산업분야선두기업들에의해스마트엣지및물리적AI로드맵의핵심요소로라이선스되었습니다.​물리적AI로의산업전환이번수상은Ceva의최고전략책임자IriTrashanski가11월14일신주에서열린회사의기술심포지엄에서엣지AI기술솔루션을선보이며,엣지AI와물리적AI트렌드가칩산업을재편할위치에있음을강조한것과함께이루어졌습니다.물리적AI는지능,인식및행동의융합을나타내며,"감지,사고,행동"프레임워크를통해AI를데이터센터에서실제세계에서작동하는기계로가져옵니다.​Ceva의AI부문수석부사장인YaronGalitzky는"IoT엣지컴퓨팅우수상수상은엣지AI의미래를형성하는데있어우리NeuPro-NanoNPU의영향력을강조합니다"라고말했습니다."NeuPro-Nano는이미선도적인소비자및산업혁신가들로부터수십억개의장치에직접지능을내장하는데신뢰받고있습니다."​성장하는시장기회이번수상은Ceva가이달초와의장기파트너십을발표한데이어나온것으로,이파트너십을통해Ceva의NeuProNPU제품군이임베디드시스템부터고급생성형AI애플리케이션에이르는제품전반에통합될예정입니다.글로벌NPUIP시장은소비자전자제품,자동차시스템및산업자동화분야에서AI워크로드통합이증가함에따라2025년1억7,250만달러에서2035년까지6억120만달러로성장할것으로예상됩니다.​Bluetooth,Wi-Fi,UWB,5G및셀룰러IoT를아우르는Ceva의연결성IP와결합하여,NeuPro-Nano는반도체및OEM업체들이스마트엣지생태계전반에서원활하게연결,감지및추론하는제품을만들수있도록지원합니다.Ceva에따르면,이회사의기술은AI가탑재된스마트워치및웨어러블기기부터자율주행차량및5G모바일네트워크에이르기까지전세계200억개이상의스마트엣지제품에적용되고있습니다.
792 조회
0 추천
2025.11.18 등록
(퍼플렉시티가정리한기사)인공지능과첨단디지털기술은청정에너지전환을위한필수도구로부상했으며,오늘가발표한새로운보고서에따르면에너지부문임원의70%이상이이를중요한촉진제로보고있습니다.19개국의1,400명의고위임원을대상으로조사한SiemensInfrastructureTransitionMonitor2025는에너지기업의59%가자율그리드시스템에대규모투자를계획하고있으며,68%가이러한기술을배출량감소에필수적이라고생각하는것으로나타났습니다.응답자의거의4분의3이향후3년내에AI가운영을변화시킬것으로예상하며,74%는이미AI가핵심인프라를더욱탄력적으로만드는데도움이되고있다고보고했습니다.​2년마다실시되는이연구에따르면,에너지부문리더들은전력망을관리하기위한자율시스템배치의가장가능성높은이점으로운영비용절감,에너지효율성향상,그리고더높은신뢰성을꼽았습니다.​인프라장애물이진전을늦추다디지털솔루션에대한열정에도불구하고,보고서는전환을가로막는지속적인과제들을드러냈다.에너지기업의절반이상인58%가미래에너지시스템설계에대한불확실성을청정에너지기술에대한투자를지연시키는요인으로꼽았다.​경영진의65%가전기화가넷제로에너지시스템달성을위한가장실용적인경로라는데동의하는반면,73%는부적절한전력망인프라가진전을제약하고있다고보고했다.이러한조사결과는국제에너지기구(InternationalEnergyAgency)추정에따르면투자및허가지연으로인해전세계적으로1,650기가와트의태양광및풍력용량이전력망연결을기다리고있다는광범위한산업데이터와일치한다.​"구식전력망인프라는청정에너지전환에심각한위협을가한다"고지멘스그리드소프트웨어(SiemensGridSoftware)의CEO사비네에를링하겐(SabineErlinghagen)이보고서와함께발표한성명에서말했다."자율전력망으로나아가기위해디지털기술을활용함으로써전력망용량을증대하고신뢰성과회복력을보장할수있다".​에를링하겐은에너지시스템이청정에너지미래의요구를충족할수있도록규제가디지털화및혁신과보조를맞춰야한다고강조했다.​산업이자율운영으로나아가다이보고서의발표는에너지부문참여자들이AI기반전력망관리솔루션을배포하기위한파트너십을가속화하고있는시점에나왔습니다.11월13일,지멘스는전력망계획,자산관리및현장서비스운영을위한통합산업용AI솔루션을제공하기위해엔터프라이즈소프트웨어공급업체IFS와전략적파트너십을발표했습니다.이협력은유틸리티기업들이자산고장을예측하고,유지보수일정을최적화하며,자율전력망운영을조율할수있도록하는것을목표로합니다.​이연구는화석연료발전의단계적폐지,대규모에너지저장및재생에너지용량확대를포함한영역에서2023년판과비교하여진전이있었음을언급했습니다.그러나데이터통합,구식규제프레임워크,저압전력망의제한된가시성과관련된과제들이여전히고급디지털기술의배포를방해하고있습니다.
910 조회
0 추천
2025.11.18 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입