(퍼플렉시티가정리한기사)소니AI는화요일에컴퓨터비전모델의편향성을드러내기위해설계된획기적인동의기반데이터셋인FairHuman-CentricImageBenchmark(FHIBE)를출시했습니다.Nature에게재된이번출시는AI시스템전반의공정성을평가하기위해특별히제작된최초의공개적으로이용가능한전세계적으로다양한데이터셋을나타내며,기존모델중윤리적기준을완전히충족하는것은없다는사실을밝혀냅니다.이데이터셋은81개국에서온1,981명의자원자들의10,318개이미지로구성되어있으며,모두사전동의와공정한보상을받고수집되었습니다.참가자들은언제든지자신의이미지를철회할권리를보유하며,이는허가없이웹데이터를수집하는업계관행에서벗어난것입니다.AI모델전반에걸쳐광범위한편향성발견SonyAI의테스트는현재컴퓨터비전시스템에서"she/her/hers"대명사를사용하는개인에대한정확도가낮은것을포함하여지속적인편향이존재함을밝혀냈습니다.벤치마크는이러한격차가부분적으로해당인구집단의더큰헤어스타일다양성에서비롯된다는것을확인했는데,이는공정성연구에서이전에간과되었던요인입니다.모델이직업에대한중립적인질문을받았을때더우려스러운패턴이나타났습니다.AI시스템은인구통계학적특성에기반하여대상을성노동자,마약거래상또는도둑으로묘사하면서해로운고정관념을자주강화했습니다.범죄활동에대해질문을받았을때,모델은아프리카계또는아시아계조상을가진개인,더어두운피부톤을가진사람,그리고"he/him/his"로식별되는사람들에대해더높은비율로유해한응답을생성했습니다.SonyAI의연구에따르면,"기존의대규모언어모델중FHIBE의모든공정성테스트를통과한것은없었으며,이는AI의내재된편향과포용성부족이여전히지속적인문제로남아있음을보여줍니다".새로운업계표준설정소니그룹의글로벌AI거버넌스책임자인AliceXiang은오랜업계관행을해결하는데있어이데이터셋의중요성을강조했습니다."업계는너무오랫동안다양성이부족하고,편향을강화하며,적절한동의없이수집된데이터셋에의존해왔습니다"라고그녀는말했습니다."이프로젝트는사전동의,개인정보보호,공정한보상,안전,다양성및유용성에대한모범사례를통합한책임있는데이터수집이가능하다는것을보여줍니다."개발비용은3년동안100만달러미만이었으며,Nature의사설보도에따르면"많은기술기업들에게는바다의물한방울"에불과한금액입니다.이비교적적은투자는윤리적데이터수집이엄청나게비싸다는업계의주장에이의를제기합니다.소니AI의사장인MichaelSpranger는이번출시를"AI데이터셋에대한새로운업계기준"을확립하는것으로평가하며,"데이터를책임감있게수집하는것이가능하다는것을증명하고,처음부터신뢰할수있는AI를구축하는데도움이된다"고말했습니다.FHIBE데이터셋은현재fairnessbenchmark.ai.sony에서공개적으로이용가능하며,전세계연구자와개발자에게컴퓨터비전시스템의편향을식별하고완화할수있는도구를제공합니다.