Loading...

AI 뉴스

연구들이 AI 훈련 데이터와 테스트의 결함을 드러내다

페이지 정보

작성자 xtalfi
작성일 11.07 14:52
83 조회
0 추천
0 비추천

본문

251105-ai-safety-tests-lr-10661e.jpg

(퍼플렉시티가 정리한 기사)


이번 주에 발표된 두 가지 주요 연구는 인공지능 시스템이 구축되고 평가되는 방식의 심각한 약점을 드러내며, AI 능력이 과장되어 왔는지에 대한 의문을 제기하고 있다.

Sony AI는 11월 5일 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 데이터셋인 Fair Human-Centric Image Benchmark를 공개했으며, 옥스퍼드 인터넷 연구소와 영국 정부의 AI 보안 연구소 연구원들은 AI 성능을 측정하는 데 사용되는 테스트의 광범위한 결함을 밝히는 연구를 발표했다. 이러한 연구 결과들은 많은 AI 시스템이 윤리적으로 문제가 있는 데이터로 훈련되고 신뢰할 수 없는 방법으로 평가될 수 있음을 시사한다.​


훈련 데이터에 동의와 다양성이 부족함

Sony AI가 Nature에 발표한 새로운 벤치마크는 연구자들이 컴퓨터 비전 시스템에서 "편향되고 윤리적으로 문제가 있는 학습 데이터의 지속적인 과제"라고 부르는 문제를 다룹니다. 이 데이터셋은 81개국 1,981명의 개인이 찍힌 10,318장의 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받아 수집되었습니다—이는 업계 관행과 크게 다른 방식입니다.​

Sony Group의 AI 거버넌스 글로벌 책임자인 Alice Xiang은 컴퓨터 비전이 객관적이지 않다고 강조했습니다. "컴퓨터 비전은 학습 데이터에 반영된 편향에 따라 사물을 왜곡할 수 있습니다"라고 그녀는 말했습니다. 데이터셋은 기존 AI 모델 중 공정성 테스트를 완전히 통과한 모델이 없다는 것을 보여주었습니다. 일부 모델은 "she/her/hers" 대명사를 사용하는 사람들에 대해 낮은 정확도를 보였으며, 벤치마크는 이를 더 큰 헤어스타일 변동성—이전에 간과되었던 요인—으로 추적했습니다. 직업에 대한 중립적인 질문을 받았을 때, 테스트된 모델들은 특정 인구통계학적 그룹에 대해 특히 고정관념을 강화했으며, 때로는 피사체를 성매매 종사자, 마약상 또는 도둑으로 묘사했습니다.​


벤치마크 테스트가 신뢰할 수 없고 오해의 소지가 있는 것으로 밝혀짐

옥스퍼드 연구팀은 445개 AI 벤치마크를 조사한 결과, 거의 모든 벤치마크에 기술 기업들이 주장하는 결과의 신뢰성을 "약화시키는 결함"이 있음을 발견했습니다. 벤치마크 중 통계적 테스트를 통해 신뢰성을 증명한 것은 16%에 불과했습니다.​

핵심적인 문제는 구성 타당성(construct validity), 즉 테스트가 실제로 그들이 측정한다고 주장하는 것을 제대로 측정하는지에 관한 것입니다. 옥스퍼드 인터넷 연구소의 수석 연구원인 아담 마디(Adam Mahdi)는 NBC 뉴스와의 인터뷰에서, 그레이드 스쿨 매스 8K(Grade School Math 8K) 벤치마크와 같은 테스트에서 모델이 좋은 성과를 거둔다고 해서 반드시 추론 능력을 보여준다고 할 수는 없다고 말했습니다. 그는 "1학년 학생에게 '2 더하기 5가 뭐야?'라고 물었을 때 '7이에요'라고 답하면, 분명 정답입니다. 하지만 이로부터 5학년이 수학적 추론을 완벽하게 습득했다고 결론지을 수 있을까요?"라고 덧붙였습니다.​

이번 연구는 데이터 오염(data contamination)을 주요 문제로 지적했는데, 이는 테스트 문항이 모델의 학습 데이터셋에 포함되어 있어 모델이 답을 추론하는 것이 아니라 암기해서 답을 내는 현상입니다. Mixtral, Phi-3, Gemma를 포함한 여러 모델은 GSM8K 벤치마크와 유사한 신규 문항으로 평가할 때 성능이 최대 13%까지 저하되는 것으로 나타났습니다.​

옥스퍼드 연구의 수석 저자인 앤드루 빈(Andrew Bean)은 업계에서 내놓는 주장들을 그대로 믿어서는 안 된다고 경고했습니다. "모델이 박사 수준의 지능을 가졌다는 것 같은 이야기를 볼 때는 한 번쯤 의심해볼 필요가 있습니다,"라고 빈은 NBC 뉴스에 말했습니다. 이번 연구 결과는 최근 구글이 자사의 Gemma AI 모델이 미국 상원의원에 관한 허위 주장을 생성한 후에 모델을 철회한 상황에서 나왔습니다.

댓글 0
전체 863 / 15 페이지
(퍼플렉시티가정리한기사)ServiceNow와Figma는2025년11월5일,개발자들이ModelContextProtocol(MCP)로구동되는통합을통해Figma디자인을기능적인엔터프라이즈애플리케이션으로직접변환할수있도록하는전략적협력을발표했습니다.이파트너십은디자인컨셉을작동하는엔터프라이즈소프트웨어로전환하는데필요한시간을획기적으로단축하는것을목표로합니다.혁신적인디자인-투-코드자동화새로운통합을통해사용자는Figma디자인링크를ServiceNow의BuildAgent에직접프롬프트로제출할수있으며,이를통해안전하고확장가능하며완전히기능하는엔터프라이즈애플리케이션이자동으로생성됩니다.초기결과에따르면이프로세스는초기UI및데이터모델구현시간을80%이상단축할수있습니다.​ServiceNow의AmyLokey최고경험책임자(ExecutiveVicePresidentandChiefExperienceOfficer)는"Figma와ServiceNow의AI기반워크플로우를연결함으로써팀이아이디어를몇분만에엔터프라이즈수준의애플리케이션으로전환하는것을손쉽게만들고있습니다"라고말했습니다.​이통합은Figma의MCPServer를활용하며,이는ServiceNowBuildAgent에디자인구성요소,스타일및레이아웃에대한구조화된이해를제공하여단순한이미지인식을넘어엔터프라이즈급애플리케이션으로의고품질변환을보장합니다.​엔터프라이즈급보안및거버넌스이협업은핵심기업과제를해결합니다:초기단계디자인을보안및거버넌스표준을유지하면서대규모로안정적으로수행할수있는솔루션으로전환하는것입니다.이시스템은OAuth2.0인증과안전한서버간통신을사용하며,토큰은고객의ServiceNow인스턴스내에저장되어데이터프라이버시와규정준수를보장합니다.​Figma의최고기술책임자인KrisRasmussen은"AI가생성한소프트웨어의세계에서디자인은귀사의제품을돋보이게만드는차별화요소입니다"라고말했습니다."이MCP통합은중요한Figma디자인컨텍스트를ServiceNow의AI워크플로우에직접제공하여팀이고품질의차별화된엔터프라이즈제품을효율적으로구축할수있도록돕습니다".​시장상황및가용성이통합은엔터프라이즈소프트웨어시장이로우코드및AI기반개발솔루션을점점더수용함에따라이루어졌습니다.Anthropic이AI에이전트와애플리케이션을연결하기위한개방형표준으로개발한ModelContextProtocol은업계전반에서주목을받고있습니다.​새로운통합은최신BuildAgent릴리스와함께ServiceNowStore를통해고객에게제공되며,설치후요청시액세스가활성화됩니다.이번협업은Figma의최근매출전망상향조정및2025년10월에발표된GoogleCloud와의계약을포함한AI파트너십확대에이어이루어졌습니다.
74 조회
0 추천
11.07 등록
(퍼플렉시티가정리한기사)덴마크는시민들에게자신의초상에대한저작권소유권을부여하는선구적인법안을제정할준비를하고있으며,이는AI생성딥페이크의증가하는위협에대한세계에서가장포괄적인정부대응중하나입니다.광범위한초당적지지를받고있는이법안은내년초통과될것으로예상되며,덴마크국민들이자신의동의없이생성된가짜콘텐츠의삭제를요구할수있도록허용할것입니다.혁명적인법적프레임워크가디지털신원도용을겨냥하다2025년7월공개협의에회부된덴마크저작권법개정안은외모,목소리,얼굴특징과같은개인적특성을지적재산으로취급하는전례없는접근방식을취하고있다.덴마크문화부장관야코브엥겔-슈미트는이법안이"모든사람은자신의신체,자신의목소리,자신의얼굴특징에대한권리를가진다는명확한메시지"를전달한다고밝혔다.​이법안체계하에서시민들은무단딥페이크콘텐츠에대해삭제요청을발행할수있는법적권한을갖게되며,플랫폼은이를준수하지않을경우높은벌금을물게된다.보호기간은개인사망후50년까지연장되며,예술가들은자신의디지털초상권의무단사용에대해보상을요구할수있다.​컨설팅회사레이턴트스페이스어드바이저리의설립자이자생성형AI분야의선도적전문가인헨리아제르는덴마크의이시도를칭찬했다."지금은사람들이'딥페이크로부터자신을보호하기위해무엇을할수있나요?'라고물으면제가대부분의경우해야하는답변은'할수있는일이많지않습니다'입니다"라고그는말했다."기본적으로'인터넷에서자신을완전히지워야한다'고말하지않는한말이죠.그런데그건사실상불가능합니다".​디지털권리보호를위한글로벌청사진덴마크의입법은전세계정부들이빠르게발전하는딥페이크기술과씨름하는가운데이루어졌습니다.2025년8월에발효된유럽연합의AI법이AI생성콘텐츠의공개를요구하는반면,덴마크의접근방식은집행가능한저작권청구권을만들어냄으로써한걸음더나아갑니다.미국은2025년5월TAKEITDOWN법을제정하여딥페이크를포함한비동의성적이미지를범죄화했지만,덴마크가제안하는포괄적인신원보호는부족합니다.​현재EU순회의장국을맡고있는덴마크는유럽전역에유사한입법을추진할계획을밝혔으며,프랑스와아일랜드가관심을표명했습니다.엥겔-슈미트는정치인들이대응수단없이딥페이크의대상이되도록허용하는것은"우리의민주주의를훼손할것"이라고말하며민주적함의를강조했습니다.​이법안은여성을불균형적으로표적으로삼고몇시간내에평판을파괴할수있는딥페이크남용에대한증가하는우려를다룹니다.2021년온라인에서자신의디지털조작된누드이미지를발견한덴마크비디오게임스트리머마리왓슨은정부의조치를환영했지만더빠른플랫폼대응의필요성을강조했습니다."일단온라인에올라가면끝입니다"라고왓슨은말했습니다."아무것도할수없고,통제를벗어납니다".
70 조회
0 추천
11.07 등록
(퍼플렉시티가정리한기사)구글은인공지능스타트업앤트로픽(Anthropic)에대한투자를대폭늘리기위한초기논의를진행중이며,이는회사가치를3,500억달러이상으로평가할가능성이있다고수요일여러보도에서전해졌다.이번협상은거대기술기업들이빠르게진화하는분야에서우위를차지하기위해경쟁하는가운데AI군비경쟁의주요확대를나타낸다.​투자구조는여전히협상중잠재적인거래는Google이Anthropic에추가클라우드컴퓨팅서비스를제공하는전략적투자,전환사채,또는내년초로예정된가격책정펀딩라운드를포함한다양한형태를취할수있습니다.Google의투자규모와다른투자자들의참여여부는아직협상이진행중이므로명확하지않습니다.​Google은이미Anthropic에30억달러이상을투자하여회사의약14%지분을확보했습니다.2021년OpenAI출신직원들이설립한샌프란시스코기반의이스타트업은OpenAI의ChatGPT와직접경쟁하는Claude계열의대규모언어모델로가장잘알려져있습니다.​OpenAI와의경쟁심화이러한논의는Anthropic이Microsoft지원을받는OpenAI로부터증가하는압박에직면한가운데이루어지고있습니다.OpenAI는최근2025년10월2차주식매각을통해5,000억달러의기업가치를달성했습니다.Microsoft와OpenAI의파트너십은지난달재구성되어,이기술대기업은약1,350억달러상당의27%지분을확보했습니다.​Anthropic은최근9월에130억달러규모의펀딩라운드를완료하여회사가치를1,380억달러로평가받았습니다.Amazon은이회사에80억달러를투자했으며주요클라우드제공업체로활동하고있습니다.한편Google의잠재적신규투자는경쟁사와의기업가치격차를좁히는것을목표로하고있습니다.​전략적클라우드컴퓨팅파트너십투자협상은10월에구글과Anthropic간에발표된기존의수십억달러규모의클라우드컴퓨팅계약을기반으로합니다.이계약은Anthropic에게구글의맞춤설계된텐서처리장치(TPU)최대100만개에대한액세스권한을부여하며,수백억달러의가치가있으며2026년에1기가와트이상의용량이온라인으로제공될것으로예상됩니다.​구글클라우드의CEO인ThomasKurian은"Anthropic이TPU사용을대폭확대하기로선택한것은수년간TPU를통해팀들이경험한강력한가격대비성능과효율성을반영합니다"라고말했습니다.확대된파트너십은Anthropic이기하급수적으로증가하는수요를충족하면서업계최첨단수준에서모델을유지할수있도록보장합니다.​Anthropic은구글의TPU,아마존의Trainium칩,그리고Nvidia의GPU등세가지칩플랫폼에걸쳐다각화된컴퓨팅전략을유지하고있습니다.회사는구글의특화된AI인프라를활용하면서아마존을주요훈련파트너로서의파트너십에계속전념하고있습니다.
74 조회
0 추천
11.07 등록
(퍼플렉시티가정리한기사)Amazon이ClaudeAI개발사인인공지능스타트업Anthropic에대한이미상당한투자를확대하고있는것으로알려졌으며,이는회사가치를3,500억달러이상으로평가할수있는펀딩라운드를준비하는시점에이루어지고있습니다.이러한움직임은거대기술기업들이빠르게진화하는AI환경을지배하기위한경쟁을가속화하는가운데나타났습니다.Google역시Anthropic에대한투자를심화하기위한초기논의중에있다고이번주여러보도에서전했습니다.이번잠재적인신규펀딩라운드는차세대AI모델의지배력을확보하기위한기술기업들간의수조달러규모의경쟁이심화되고있음을반영하며,Amazon과Google은Anthropic을지원하는반면Microsoft와Nvidia는경쟁사인OpenAI에수십억달러를투자했습니다.​전략적파트너십이Claude의성장을견인하다Amazon은이미Anthropic에140억달러를투자하여이스타트업의최대투자자중하나가되었습니다.이파트너십은재정적지원을넘어서며,AmazonWebServices는Anthropic의ClaudeAI모델을위한주요클라우드제공업체이자훈련파트너로활동하고있습니다.​이협력은10월말Amazon이거의500,000개의Trainium2칩을갖춘세계최대AI컴퓨팅클러스터중하나인ProjectRainier를가동하면서중요한이정표에도달했습니다.Anthropic은Claude를구축하고배포하기위해이인프라를적극적으로사용하고있으며,2025년말까지100만개이상의Trainium2칩으로확장할계획입니다.​AWS의저명한엔지니어인RonDiamant는"ProjectRainier는AWS의가장야심찬사업중하나입니다"라고말하며,이대규모인프라프로젝트를"차세대인공지능모델의시대를열기위해"설계되었다고설명했습니다.​거대기술기업들의AI패권경쟁잠재적인3,500억달러가치평가는Anthropic이9월130억달러규모의펀딩라운드에서달성한현재1,830억달러가치평가에서상당한도약을의미할것입니다.한편,경쟁사인OpenAI는지난달5,000억달러가치평가에도달하여AI기업가치평가의급속한상승을보여주고있습니다.​전OpenAI직원들이2021년에설립한Anthropic은AI안전성과책임있는개발분야의선두주자로자리매김했습니다.이회사의Claude대규모언어모델제품군은빠르게확장되는생성형AI시장에서OpenAI의ChatGPT와직접경쟁하고있습니다.​이러한경쟁은업계전반에걸쳐전례없는인프라투자를촉발했습니다.Amazon은최근OpenAI와380억달러규모의클라우드계약을체결하여,시장이발전하는동안클라우드제공업체들이여러AI플랫폼을지원하기위해어떻게포지셔닝하고있는지를보여주었습니다.Google또한Anthropic에30억달러이상을투자하고수백억달러규모의주요클라우드컴퓨팅계약을체결하여Google의맞춤형텐서처리장치최대100만개에대한액세스를제공하고있습니다.
77 조회
0 추천
11.07 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입