Loading...

AI 뉴스

연구들이 AI 훈련 데이터와 테스트의 결함을 드러내다

페이지 정보

작성자 xtalfi
작성일 11.07 14:52
213 조회
0 추천
0 비추천

본문

251105-ai-safety-tests-lr-10661e.jpg

(퍼플렉시티가 정리한 기사)


이번 주에 발표된 두 가지 주요 연구는 인공지능 시스템이 구축되고 평가되는 방식의 심각한 약점을 드러내며, AI 능력이 과장되어 왔는지에 대한 의문을 제기하고 있다.

Sony AI는 11월 5일 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 데이터셋인 Fair Human-Centric Image Benchmark를 공개했으며, 옥스퍼드 인터넷 연구소와 영국 정부의 AI 보안 연구소 연구원들은 AI 성능을 측정하는 데 사용되는 테스트의 광범위한 결함을 밝히는 연구를 발표했다. 이러한 연구 결과들은 많은 AI 시스템이 윤리적으로 문제가 있는 데이터로 훈련되고 신뢰할 수 없는 방법으로 평가될 수 있음을 시사한다.​


훈련 데이터에 동의와 다양성이 부족함

Sony AI가 Nature에 발표한 새로운 벤치마크는 연구자들이 컴퓨터 비전 시스템에서 "편향되고 윤리적으로 문제가 있는 학습 데이터의 지속적인 과제"라고 부르는 문제를 다룹니다. 이 데이터셋은 81개국 1,981명의 개인이 찍힌 10,318장의 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받아 수집되었습니다—이는 업계 관행과 크게 다른 방식입니다.​

Sony Group의 AI 거버넌스 글로벌 책임자인 Alice Xiang은 컴퓨터 비전이 객관적이지 않다고 강조했습니다. "컴퓨터 비전은 학습 데이터에 반영된 편향에 따라 사물을 왜곡할 수 있습니다"라고 그녀는 말했습니다. 데이터셋은 기존 AI 모델 중 공정성 테스트를 완전히 통과한 모델이 없다는 것을 보여주었습니다. 일부 모델은 "she/her/hers" 대명사를 사용하는 사람들에 대해 낮은 정확도를 보였으며, 벤치마크는 이를 더 큰 헤어스타일 변동성—이전에 간과되었던 요인—으로 추적했습니다. 직업에 대한 중립적인 질문을 받았을 때, 테스트된 모델들은 특정 인구통계학적 그룹에 대해 특히 고정관념을 강화했으며, 때로는 피사체를 성매매 종사자, 마약상 또는 도둑으로 묘사했습니다.​


벤치마크 테스트가 신뢰할 수 없고 오해의 소지가 있는 것으로 밝혀짐

옥스퍼드 연구팀은 445개 AI 벤치마크를 조사한 결과, 거의 모든 벤치마크에 기술 기업들이 주장하는 결과의 신뢰성을 "약화시키는 결함"이 있음을 발견했습니다. 벤치마크 중 통계적 테스트를 통해 신뢰성을 증명한 것은 16%에 불과했습니다.​

핵심적인 문제는 구성 타당성(construct validity), 즉 테스트가 실제로 그들이 측정한다고 주장하는 것을 제대로 측정하는지에 관한 것입니다. 옥스퍼드 인터넷 연구소의 수석 연구원인 아담 마디(Adam Mahdi)는 NBC 뉴스와의 인터뷰에서, 그레이드 스쿨 매스 8K(Grade School Math 8K) 벤치마크와 같은 테스트에서 모델이 좋은 성과를 거둔다고 해서 반드시 추론 능력을 보여준다고 할 수는 없다고 말했습니다. 그는 "1학년 학생에게 '2 더하기 5가 뭐야?'라고 물었을 때 '7이에요'라고 답하면, 분명 정답입니다. 하지만 이로부터 5학년이 수학적 추론을 완벽하게 습득했다고 결론지을 수 있을까요?"라고 덧붙였습니다.​

이번 연구는 데이터 오염(data contamination)을 주요 문제로 지적했는데, 이는 테스트 문항이 모델의 학습 데이터셋에 포함되어 있어 모델이 답을 추론하는 것이 아니라 암기해서 답을 내는 현상입니다. Mixtral, Phi-3, Gemma를 포함한 여러 모델은 GSM8K 벤치마크와 유사한 신규 문항으로 평가할 때 성능이 최대 13%까지 저하되는 것으로 나타났습니다.​

옥스퍼드 연구의 수석 저자인 앤드루 빈(Andrew Bean)은 업계에서 내놓는 주장들을 그대로 믿어서는 안 된다고 경고했습니다. "모델이 박사 수준의 지능을 가졌다는 것 같은 이야기를 볼 때는 한 번쯤 의심해볼 필요가 있습니다,"라고 빈은 NBC 뉴스에 말했습니다. 이번 연구 결과는 최근 구글이 자사의 Gemma AI 모델이 미국 상원의원에 관한 허위 주장을 생성한 후에 모델을 철회한 상황에서 나왔습니다.

댓글 0
전체 1,144 / 95 페이지
(퍼플렉시티가정리한기사)대만의폭스콘은10월매출이NT$8,957억달러(290억달러)를기록하며전년대비11.3%증가했다고발표했습니다.이는인공지능서버수요가계속해서이전자제품제조업체의성장을견인하고있기때문입니다.11월5일발표된이번실적은NT$2.06조의매출을달성한기록적인3분기실적의모멘텀을이어가고있습니다.​세계최대전자제품위탁제조업체이자애플아이폰의주요조립업체인폭스콘은AI인프라붐의핵심플레이어로변모했습니다.AI서버는현재폭스콘전체서버매출의50%이상을차지하고있으며,이는클라우드및네트워킹부문이회사의전통적인소비자전자제품사업을처음으로추월한것입니다.​AI인프라투자가수요를견인하다Foxconn의매출급증은AI인프라지출의광범위한추세를반영하며,기업들은2025년1월부터10월까지전세계적으로거의1조달러를투자했습니다.회사는클라우드서비스제공업체와기업의수요가둔화될기미를보이지않음에따라2025년12월로끝나는분기에15%의매출증가를예상하고있습니다.​Foxconn회장YoungLiu는올해초"AI서버매출은2분기에전분기및전년대비거의두배로증가할것으로예상된다"며2025년을"AI의원년"으로묘사했습니다.회사는AI서버관련매출이연간1조NT달러를초과하여전체서버사업의절반이상을차지할것으로예상합니다.​TrendForce는전세계AI서버출하량이2026년에20%이상성장할것으로전망하며,AI서버가전체서버출하량의17%를차지할것으로예측합니다.시장조사회사는AI서버매출이2026년에30%이상증가하여전체서버시장가치의74%를차지할것으로추정합니다.​글로벌입지확대Foxconn은전세계적으로AI서버제조능력을공격적으로확장하고있습니다.회사는NvidiaAI서버를생산하는휴스턴공장에휴머노이드로봇을배치할계획을발표했으며,2026년초에운영을시작할예정입니다.또한Foxconn은증가하는수요를충족하기위해위스콘신,텍사스,캘리포니아에서AI서버생산능력을확장하고있습니다.​제조업체는또한Nvidia와의파트너십을강화했으며,여기에는Foxconn의가오슝데이터센터에서Nvidia의첨단전력아키텍처를사용하여AI팩토리인프라를개발하는협력이포함됩니다.10월에는류회장이OpenAI임원들과만나고Nvidia경영진과의논의를계획했다는보도에따라Foxconn의주가가8%상승했습니다.​지정학적불확실성에도불구하고,Foxconn의주가는올해23%상승하여대만시장전체의16%상승률을능가했습니다.회사는11월12일에3분기실적을발표할예정입니다.
304 조회
0 추천
11.06 등록
(퍼플렉시티가정리한기사)중국로봇제조업체Dobot이이번주RoverX1로봇개를출시하며,다기능사족보행로봇의가격을7,499위안(약1,050달러)으로책정하고프리미엄산업용모델의접근가능한대안으로포지셔닝했습니다.협동산업용로봇으로더잘알려진선전기반회사는RoverX1출시첫날5,000건이상의예약을받았습니다.​경쟁력있는가격이시장을혼란시키다RoverX1은소비자용로봇개시장의기존경쟁제품들에비해가격을크게낮췄습니다.BostonDynamics의산업용등급Spot로봇이75,000달러이상이고,Unitree의Go2사족보행로봇이약1,600달러부터시작하는반면,Dobot의진입가격은고급로봇기능에대한극적인가격인하를나타냅니다.업계분석에따르면,RoverX1의사양은일반적으로약2,800달러에가격이책정되는상위급Unitree구성과비슷합니다.​​이로봇은360도환경인식을위한듀얼비전트래킹,다양한지형탐색을위한하이브리드휠-레그디자인,그리고스마트하중지지기능을갖추고있습니다.음성명령제어를통해RoverX1은모바일보안카메라,개인사진작가,교육용코딩플랫폼,그리고가정용반려로봇으로기능할수있습니다.​소비자로봇공학의시장영향업계전문가들은이번출시를첨단로봇공학의시장접근성이확대되고있다는신호로보고있습니다.2025년약10억6,600만달러로평가되는전세계소비자용로봇개시장은연평균12.8%의성장률로2031년까지21억9,100만달러에달할것으로예상됩니다.Dobot의공격적인가격전략은산업수준의로봇공학기술을가정환경으로도입함으로써도입을가속화할수있습니다.​2015년에설립된Dobot은100개국에걸쳐100,000대이상의협동로봇을배치하며선도적인협동로봇제조업체로자리매김했습니다.산업자동화에서소비자로봇공학으로의전환은성장하는가정용로봇시장을향한전략적전환점을나타냅니다.
287 조회
0 추천
11.06 등록
(퍼플렉시티가정리한기사)중국은모든국가지원데이터센터프로젝트에서국내생산인공지능칩만을사용하도록요구하는전면적인새지침을발표했으며,이는베이징이핵심인프라에서외국기술을제거하기위한가장공격적인조치중하나입니다.​중국규제당국은최근30%미만으로완료된데이터센터에설치된모든외국칩을제거하거나조달계획을취소하도록명령했으며,더진행된프로젝트는사례별로평가될예정입니다.이정책은Nvidia,AMD,Intel을포함한주요미국칩제조업체를대상으로하며,이들을수익성높은정부지원프로젝트에서차단할가능성이있습니다.​막대한시장이걸려있다위험부담이상당합니다.로이터의정부입찰분석에따르면,중국의AI데이터센터프로젝트는2021년이후1,000억달러이상의국가자금을유치했습니다.중국의대부분의데이터센터는어떤형태로든국가지원을받았지만,정확히얼마나많은프로젝트가새로운제한조치의적용을받는지는여전히불명확합니다.​일부사업은이미중단되었는데,여기에는Nvidia칩을배치할계획이었던중국북서부의시설이포함됩니다.국가자금지원을받는민간기술회사가후원한이프로젝트는건설이시작되기전에보류되었습니다.​이지침은현재미국수출통제하에서회사가중국에판매할수있도록허용된가장진보된AI프로세서인Nvidia의H20칩과,B200및H200과같은더강력한프로세서를포함합니다.후자의칩들은미국규정에의해공식적으로제한되어있지만,비공식경로를통해여전히구할수있습니다.​전략적기술경쟁심화이번조치는미중기술갈등이고조되는가운데나온것으로,도널드트럼프대통령은최근미국의가장첨단칩은미국기업에만독점적으로공급될것이라고선언했습니다.트럼프는최근인터뷰에서"가장첨단칩은미국외에는누구에게도제공하지않을것"이라고밝혔습니다.​이지침은2026년까지Ascend910C칩생산량을60만대로두배늘릴계획인화웨이테크놀로지스를포함한중국국내칩제조업체들에게상당한이익을가져다줄수있습니다.캠브리콘테크놀로지스,무어스레드,메타엑스와같은다른국내업체들도시장점유율을확보할수있는위치에있습니다.​그러나이정책은AI컴퓨팅능력에서미국과중국간의기술격차를확대할위험도있습니다.중국기업들이진전을이루긴했지만,기존제재로인해엔비디아의중국AI칩시장점유율은이미2022년95%에서현재사실상0%로급락했습니다.
298 조회
0 추천
11.05 등록
(퍼플렉시티가정리한기사)Anthropic은2028년까지최대700억달러의매출과170억달러의현금흐름을창출할것으로예상하고있으며,이는경쟁사인OpenAI가성장을위해계속현금을소진하는동안이인공지능스타트업을기업시장의잠재적승자로자리매김하게합니다.급격한B2B성장이공격적인전망을이끌다TheInformation이처음보도한이전망치는올해Anthropic의예상매출50억달러에서극적으로급증한수치를나타냅니다.기업중심전략을펼치고있는이회사는이미상당한모멘텀을창출했으며,API매출만으로도2025년에38억달러에달할것으로예상됩니다—이는OpenAI의유사한판매를통한예상매출18억달러의두배입니다.​Anthropic의개발자도구ClaudeCode는7월4억달러에서급증하여연간매출10억달러에근접하면서주요성장동력으로부상했습니다.이회사는30만개이상의기업고객에게서비스를제공하고있으며,이들은전체매출의약80%를차지합니다.​Anthropic의최고상업책임자인PaulSmith는회사의기업파트너십에대해"우리는재정적투자든우리가기여할엔지니어링전문성이든,이협력에상당한자원을투입하고있습니다"라고말했습니다.​전략적파트너십이기업확장을촉진하다최근파트너십은Anthropic의기업시장진출에대한공격적인추진을보여줍니다.Microsoft는Anthropic의모델을Microsoft365애플리케이션과Copilot에통합하기시작했으며,이는OpenAI와의이전독점관계에서벗어난변화를나타냅니다.​Salesforce는10월에Claude통합을확대하여Anthropic을Salesforce의신뢰계층내에완전히통합된최초의대규모언어모델제공업체로만들었습니다.이파트너십은금융서비스,의료및사이버보안을포함한규제산업을대상으로합니다.​주요배포사례로는Deloitte가150개국에걸쳐470,000명이상의직원에게Claude를배포한것과전문서비스대기업Cognizant가350,000명의인력전체에AI어시스턴트를구현한것이있습니다.​수익성경로는OpenAI의현금소진과대조를이룬다OpenAI가2026년에140억달러를소진하고2029년까지1,150억달러의누적손실을기록할것으로예상되는반면,Anthropic은2027년까지긍정적인현금흐름을전망하고있습니다.이회사의총이익률은작년마이너스94%에서올해50%로급증할것으로예상되며,2028년까지77%에달할것으로보입니다.​5,000억달러의가치를인정받고주간8억명의사용자를보유한OpenAI는소비자및기업전략을모두추구하고있지만증가하는인프라비용에직면해있습니다.Anthropic의보다집중된기업접근방식은전체매출은낮지만더빠른수익성을달성할수있는위치에있는것으로보입니다.​TheInformation에따르면,매출전망은향후자금조달라운드에서3,000억달러에서4,000억달러사이의기업가치를뒷받침할수있다고합니다.Anthropic은최근9월에1,830억달러의기업가치로130억달러를조달하여2025년초보다거의3배증가한가치를기록했습니다.
300 조회
0 추천
11.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입