Loading...

AI 뉴스

연구들이 AI 훈련 데이터와 테스트의 결함을 드러내다

페이지 정보

작성자 xtalfi
작성일 11.07 14:52
77 조회
0 추천
0 비추천

본문

251105-ai-safety-tests-lr-10661e.jpg

(퍼플렉시티가 정리한 기사)


이번 주에 발표된 두 가지 주요 연구는 인공지능 시스템이 구축되고 평가되는 방식의 심각한 약점을 드러내며, AI 능력이 과장되어 왔는지에 대한 의문을 제기하고 있다.

Sony AI는 11월 5일 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 데이터셋인 Fair Human-Centric Image Benchmark를 공개했으며, 옥스퍼드 인터넷 연구소와 영국 정부의 AI 보안 연구소 연구원들은 AI 성능을 측정하는 데 사용되는 테스트의 광범위한 결함을 밝히는 연구를 발표했다. 이러한 연구 결과들은 많은 AI 시스템이 윤리적으로 문제가 있는 데이터로 훈련되고 신뢰할 수 없는 방법으로 평가될 수 있음을 시사한다.​


훈련 데이터에 동의와 다양성이 부족함

Sony AI가 Nature에 발표한 새로운 벤치마크는 연구자들이 컴퓨터 비전 시스템에서 "편향되고 윤리적으로 문제가 있는 학습 데이터의 지속적인 과제"라고 부르는 문제를 다룹니다. 이 데이터셋은 81개국 1,981명의 개인이 찍힌 10,318장의 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받아 수집되었습니다—이는 업계 관행과 크게 다른 방식입니다.​

Sony Group의 AI 거버넌스 글로벌 책임자인 Alice Xiang은 컴퓨터 비전이 객관적이지 않다고 강조했습니다. "컴퓨터 비전은 학습 데이터에 반영된 편향에 따라 사물을 왜곡할 수 있습니다"라고 그녀는 말했습니다. 데이터셋은 기존 AI 모델 중 공정성 테스트를 완전히 통과한 모델이 없다는 것을 보여주었습니다. 일부 모델은 "she/her/hers" 대명사를 사용하는 사람들에 대해 낮은 정확도를 보였으며, 벤치마크는 이를 더 큰 헤어스타일 변동성—이전에 간과되었던 요인—으로 추적했습니다. 직업에 대한 중립적인 질문을 받았을 때, 테스트된 모델들은 특정 인구통계학적 그룹에 대해 특히 고정관념을 강화했으며, 때로는 피사체를 성매매 종사자, 마약상 또는 도둑으로 묘사했습니다.​


벤치마크 테스트가 신뢰할 수 없고 오해의 소지가 있는 것으로 밝혀짐

옥스퍼드 연구팀은 445개 AI 벤치마크를 조사한 결과, 거의 모든 벤치마크에 기술 기업들이 주장하는 결과의 신뢰성을 "약화시키는 결함"이 있음을 발견했습니다. 벤치마크 중 통계적 테스트를 통해 신뢰성을 증명한 것은 16%에 불과했습니다.​

핵심적인 문제는 구성 타당성(construct validity), 즉 테스트가 실제로 그들이 측정한다고 주장하는 것을 제대로 측정하는지에 관한 것입니다. 옥스퍼드 인터넷 연구소의 수석 연구원인 아담 마디(Adam Mahdi)는 NBC 뉴스와의 인터뷰에서, 그레이드 스쿨 매스 8K(Grade School Math 8K) 벤치마크와 같은 테스트에서 모델이 좋은 성과를 거둔다고 해서 반드시 추론 능력을 보여준다고 할 수는 없다고 말했습니다. 그는 "1학년 학생에게 '2 더하기 5가 뭐야?'라고 물었을 때 '7이에요'라고 답하면, 분명 정답입니다. 하지만 이로부터 5학년이 수학적 추론을 완벽하게 습득했다고 결론지을 수 있을까요?"라고 덧붙였습니다.​

이번 연구는 데이터 오염(data contamination)을 주요 문제로 지적했는데, 이는 테스트 문항이 모델의 학습 데이터셋에 포함되어 있어 모델이 답을 추론하는 것이 아니라 암기해서 답을 내는 현상입니다. Mixtral, Phi-3, Gemma를 포함한 여러 모델은 GSM8K 벤치마크와 유사한 신규 문항으로 평가할 때 성능이 최대 13%까지 저하되는 것으로 나타났습니다.​

옥스퍼드 연구의 수석 저자인 앤드루 빈(Andrew Bean)은 업계에서 내놓는 주장들을 그대로 믿어서는 안 된다고 경고했습니다. "모델이 박사 수준의 지능을 가졌다는 것 같은 이야기를 볼 때는 한 번쯤 의심해볼 필요가 있습니다,"라고 빈은 NBC 뉴스에 말했습니다. 이번 연구 결과는 최근 구글이 자사의 Gemma AI 모델이 미국 상원의원에 관한 허위 주장을 생성한 후에 모델을 철회한 상황에서 나왔습니다.

댓글 0
전체 834 / 8 페이지
(퍼플렉시티가정리한기사)덴마크는시민들에게자신의초상에대한저작권소유권을부여하는선구적인법안을제정할준비를하고있으며,이는AI생성딥페이크의증가하는위협에대한세계에서가장포괄적인정부대응중하나입니다.광범위한초당적지지를받고있는이법안은내년초통과될것으로예상되며,덴마크국민들이자신의동의없이생성된가짜콘텐츠의삭제를요구할수있도록허용할것입니다.혁명적인법적프레임워크가디지털신원도용을겨냥하다2025년7월공개협의에회부된덴마크저작권법개정안은외모,목소리,얼굴특징과같은개인적특성을지적재산으로취급하는전례없는접근방식을취하고있다.덴마크문화부장관야코브엥겔-슈미트는이법안이"모든사람은자신의신체,자신의목소리,자신의얼굴특징에대한권리를가진다는명확한메시지"를전달한다고밝혔다.​이법안체계하에서시민들은무단딥페이크콘텐츠에대해삭제요청을발행할수있는법적권한을갖게되며,플랫폼은이를준수하지않을경우높은벌금을물게된다.보호기간은개인사망후50년까지연장되며,예술가들은자신의디지털초상권의무단사용에대해보상을요구할수있다.​컨설팅회사레이턴트스페이스어드바이저리의설립자이자생성형AI분야의선도적전문가인헨리아제르는덴마크의이시도를칭찬했다."지금은사람들이'딥페이크로부터자신을보호하기위해무엇을할수있나요?'라고물으면제가대부분의경우해야하는답변은'할수있는일이많지않습니다'입니다"라고그는말했다."기본적으로'인터넷에서자신을완전히지워야한다'고말하지않는한말이죠.그런데그건사실상불가능합니다".​디지털권리보호를위한글로벌청사진덴마크의입법은전세계정부들이빠르게발전하는딥페이크기술과씨름하는가운데이루어졌습니다.2025년8월에발효된유럽연합의AI법이AI생성콘텐츠의공개를요구하는반면,덴마크의접근방식은집행가능한저작권청구권을만들어냄으로써한걸음더나아갑니다.미국은2025년5월TAKEITDOWN법을제정하여딥페이크를포함한비동의성적이미지를범죄화했지만,덴마크가제안하는포괄적인신원보호는부족합니다.​현재EU순회의장국을맡고있는덴마크는유럽전역에유사한입법을추진할계획을밝혔으며,프랑스와아일랜드가관심을표명했습니다.엥겔-슈미트는정치인들이대응수단없이딥페이크의대상이되도록허용하는것은"우리의민주주의를훼손할것"이라고말하며민주적함의를강조했습니다.​이법안은여성을불균형적으로표적으로삼고몇시간내에평판을파괴할수있는딥페이크남용에대한증가하는우려를다룹니다.2021년온라인에서자신의디지털조작된누드이미지를발견한덴마크비디오게임스트리머마리왓슨은정부의조치를환영했지만더빠른플랫폼대응의필요성을강조했습니다."일단온라인에올라가면끝입니다"라고왓슨은말했습니다."아무것도할수없고,통제를벗어납니다".
64 조회
0 추천
11.07 등록
(퍼플렉시티가정리한기사)구글은인공지능스타트업앤트로픽(Anthropic)에대한투자를대폭늘리기위한초기논의를진행중이며,이는회사가치를3,500억달러이상으로평가할가능성이있다고수요일여러보도에서전해졌다.이번협상은거대기술기업들이빠르게진화하는분야에서우위를차지하기위해경쟁하는가운데AI군비경쟁의주요확대를나타낸다.​투자구조는여전히협상중잠재적인거래는Google이Anthropic에추가클라우드컴퓨팅서비스를제공하는전략적투자,전환사채,또는내년초로예정된가격책정펀딩라운드를포함한다양한형태를취할수있습니다.Google의투자규모와다른투자자들의참여여부는아직협상이진행중이므로명확하지않습니다.​Google은이미Anthropic에30억달러이상을투자하여회사의약14%지분을확보했습니다.2021년OpenAI출신직원들이설립한샌프란시스코기반의이스타트업은OpenAI의ChatGPT와직접경쟁하는Claude계열의대규모언어모델로가장잘알려져있습니다.​OpenAI와의경쟁심화이러한논의는Anthropic이Microsoft지원을받는OpenAI로부터증가하는압박에직면한가운데이루어지고있습니다.OpenAI는최근2025년10월2차주식매각을통해5,000억달러의기업가치를달성했습니다.Microsoft와OpenAI의파트너십은지난달재구성되어,이기술대기업은약1,350억달러상당의27%지분을확보했습니다.​Anthropic은최근9월에130억달러규모의펀딩라운드를완료하여회사가치를1,380억달러로평가받았습니다.Amazon은이회사에80억달러를투자했으며주요클라우드제공업체로활동하고있습니다.한편Google의잠재적신규투자는경쟁사와의기업가치격차를좁히는것을목표로하고있습니다.​전략적클라우드컴퓨팅파트너십투자협상은10월에구글과Anthropic간에발표된기존의수십억달러규모의클라우드컴퓨팅계약을기반으로합니다.이계약은Anthropic에게구글의맞춤설계된텐서처리장치(TPU)최대100만개에대한액세스권한을부여하며,수백억달러의가치가있으며2026년에1기가와트이상의용량이온라인으로제공될것으로예상됩니다.​구글클라우드의CEO인ThomasKurian은"Anthropic이TPU사용을대폭확대하기로선택한것은수년간TPU를통해팀들이경험한강력한가격대비성능과효율성을반영합니다"라고말했습니다.확대된파트너십은Anthropic이기하급수적으로증가하는수요를충족하면서업계최첨단수준에서모델을유지할수있도록보장합니다.​Anthropic은구글의TPU,아마존의Trainium칩,그리고Nvidia의GPU등세가지칩플랫폼에걸쳐다각화된컴퓨팅전략을유지하고있습니다.회사는구글의특화된AI인프라를활용하면서아마존을주요훈련파트너로서의파트너십에계속전념하고있습니다.
69 조회
0 추천
11.07 등록
(퍼플렉시티가정리한기사)Amazon이ClaudeAI개발사인인공지능스타트업Anthropic에대한이미상당한투자를확대하고있는것으로알려졌으며,이는회사가치를3,500억달러이상으로평가할수있는펀딩라운드를준비하는시점에이루어지고있습니다.이러한움직임은거대기술기업들이빠르게진화하는AI환경을지배하기위한경쟁을가속화하는가운데나타났습니다.Google역시Anthropic에대한투자를심화하기위한초기논의중에있다고이번주여러보도에서전했습니다.이번잠재적인신규펀딩라운드는차세대AI모델의지배력을확보하기위한기술기업들간의수조달러규모의경쟁이심화되고있음을반영하며,Amazon과Google은Anthropic을지원하는반면Microsoft와Nvidia는경쟁사인OpenAI에수십억달러를투자했습니다.​전략적파트너십이Claude의성장을견인하다Amazon은이미Anthropic에140억달러를투자하여이스타트업의최대투자자중하나가되었습니다.이파트너십은재정적지원을넘어서며,AmazonWebServices는Anthropic의ClaudeAI모델을위한주요클라우드제공업체이자훈련파트너로활동하고있습니다.​이협력은10월말Amazon이거의500,000개의Trainium2칩을갖춘세계최대AI컴퓨팅클러스터중하나인ProjectRainier를가동하면서중요한이정표에도달했습니다.Anthropic은Claude를구축하고배포하기위해이인프라를적극적으로사용하고있으며,2025년말까지100만개이상의Trainium2칩으로확장할계획입니다.​AWS의저명한엔지니어인RonDiamant는"ProjectRainier는AWS의가장야심찬사업중하나입니다"라고말하며,이대규모인프라프로젝트를"차세대인공지능모델의시대를열기위해"설계되었다고설명했습니다.​거대기술기업들의AI패권경쟁잠재적인3,500억달러가치평가는Anthropic이9월130억달러규모의펀딩라운드에서달성한현재1,830억달러가치평가에서상당한도약을의미할것입니다.한편,경쟁사인OpenAI는지난달5,000억달러가치평가에도달하여AI기업가치평가의급속한상승을보여주고있습니다.​전OpenAI직원들이2021년에설립한Anthropic은AI안전성과책임있는개발분야의선두주자로자리매김했습니다.이회사의Claude대규모언어모델제품군은빠르게확장되는생성형AI시장에서OpenAI의ChatGPT와직접경쟁하고있습니다.​이러한경쟁은업계전반에걸쳐전례없는인프라투자를촉발했습니다.Amazon은최근OpenAI와380억달러규모의클라우드계약을체결하여,시장이발전하는동안클라우드제공업체들이여러AI플랫폼을지원하기위해어떻게포지셔닝하고있는지를보여주었습니다.Google또한Anthropic에30억달러이상을투자하고수백억달러규모의주요클라우드컴퓨팅계약을체결하여Google의맞춤형텐서처리장치최대100만개에대한액세스를제공하고있습니다.
70 조회
0 추천
11.07 등록
(퍼플렉시티가정리한기사)SAP는베를린에서열린TechEd2025에서첫번째엔터프라이즈관계형파운데이션모델을공개하며,전통적인언어기반AI에서비즈니스결과예측으로의중대한전환을알렸습니다.회사는11월5일SAP-RPT-1,즉관계형사전훈련트랜스포머를발표했으며,이는"문장의다음단어가아닌비즈니스결과를예측하는새로운클래스의AI"라고설명했습니다.​텍스트를분석하는기존의대규모언어모델과달리,SAP-RPT-1은구조화된비즈니스데이터를처리하여배송지연,결제위험,판매주문완료와같은시나리오를예측합니다.스탠포드대학교와공동개발된이모델은310만개의테이블로훈련되었으며,작업별훈련이나미세조정없이예측을제공하기위해컨텍스트내학습을사용합니다.​기업용AI에대한혁신적인접근방식이번발표는엔터프라이즈AI역량의근본적인변화를알립니다."잘알려진언어모델이많이있지만,우리의훈련은비즈니스거래데이터,본질적으로Excel스프레드시트에집중했습니다"라고SAP의글로벌AI리더인WalterSun은설명했습니다."이를통해언어모델과유사한작업을수행하기위해특정회사세부정보가필요없이예측분석을수행할수있는모델이탄생했습니다."​SAP-RPT-1은엔터프라이즈환경에서일반적인관계형데이터베이스및테이블형식데이터형식과직접작동함으로써현재AI제품의중요한격차를해결합니다.이모델은세가지유형의예측을수행할수있습니다:이진분류(지불가능성과같은예/아니오결정),다중클래스분류(여러옵션중선택),그리고수치회귀작업.​광범위한AI전략확장SAP-RPT-1외에도,SAP는SAPBuild내개발자도구를확장한다고발표했으며,여기에는새로운VisualStudioCode확장프로그램과Cursor,ClaudeCode,Cline,Windsurf와같은인기개발플랫폼과의통합이포함됩니다.SAP는또한Snowflake와의파트너십을공개했으며,거버넌스와비즈니스맥락을유지하면서관리형데이터및AI기능을SAP고객에게직접제공합니다.​이회사는기술사용자를위한5개의새로운AI에이전트를출시했으며,여기에는비즈니스프로세스분석,대시보드해석,작업공간관리를위한도구가포함되어있으며,모두2026년1분기에정식출시될것으로예상됩니다.또한SAP는Coursera와같은플랫폼과의파트너십및확대된교육프로그램을통해2030년까지전세계1,200만명에게AI준비기술을제공하겠다고약속했습니다.
68 조회
0 추천
11.07 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입