AI 뉴스

소니, 모델 전반의 편향성을 드러내는 윤리적 AI 데이터셋 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.06 14:04
1,087 조회
0 추천
0 비추천

본문

2192245744_rlcnht.jpg

(퍼플렉시티가 정리한 기사)


소니 AI는 화요일에 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 획기적인 동의 기반 데이터셋인 Fair Human-Centric Image Benchmark (FHIBE)를 출시했습니다. Nature에 게재된 이번 출시는 AI 시스템 전반의 공정성을 평가하기 위해 특별히 제작된 최초의 공개적으로 이용 가능한 전 세계적으로 다양한 데이터셋을 나타내며, 기존 모델 중 윤리적 기준을 완전히 충족하는 것은 없다는 사실을 밝혀냅니다.​

이 데이터셋은 81개국에서 온 1,981명의 자원자들의 10,318개 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받고 수집되었습니다. 참가자들은 언제든지 자신의 이미지를 철회할 권리를 보유하며, 이는 허가 없이 웹 데이터를 수집하는 업계 관행에서 벗어난 것입니다.​


AI 모델 전반에 걸쳐 광범위한 편향성 발견

Sony AI의 테스트는 현재 컴퓨터 비전 시스템에서 "she/her/hers" 대명사를 사용하는 개인에 대한 정확도가 낮은 것을 포함하여 지속적인 편향이 존재함을 밝혀냈습니다. 벤치마크는 이러한 격차가 부분적으로 해당 인구 집단의 더 큰 헤어스타일 다양성에서 비롯된다는 것을 확인했는데, 이는 공정성 연구에서 이전에 간과되었던 요인입니다.​

모델이 직업에 대한 중립적인 질문을 받았을 때 더 우려스러운 패턴이 나타났습니다. AI 시스템은 인구통계학적 특성에 기반하여 대상을 성 노동자, 마약 거래상 또는 도둑으로 묘사하면서 해로운 고정관념을 자주 강화했습니다. 범죄 활동에 대해 질문을 받았을 때, 모델은 아프리카계 또는 아시아계 조상을 가진 개인, 더 어두운 피부톤을 가진 사람, 그리고 "he/him/his"로 식별되는 사람들에 대해 더 높은 비율로 유해한 응답을 생성했습니다.​

Sony AI의 연구에 따르면, "기존의 대규모 언어 모델 중 FHIBE의 모든 공정성 테스트를 통과한 것은 없었으며, 이는 AI의 내재된 편향과 포용성 부족이 여전히 지속적인 문제로 남아 있음을 보여줍니다".​


새로운 업계 표준 설정

소니 그룹의 글로벌 AI 거버넌스 책임자인 Alice Xiang은 오랜 업계 관행을 해결하는 데 있어 이 데이터셋의 중요성을 강조했습니다. "업계는 너무 오랫동안 다양성이 부족하고, 편향을 강화하며, 적절한 동의 없이 수집된 데이터셋에 의존해 왔습니다"라고 그녀는 말했습니다. "이 프로젝트는 사전 동의, 개인정보 보호, 공정한 보상, 안전, 다양성 및 유용성에 대한 모범 사례를 통합한 책임 있는 데이터 수집이 가능하다는 것을 보여줍니다."​

개발 비용은 3년 동안 100만 달러 미만이었으며, Nature의 사설 보도에 따르면 "많은 기술 기업들에게는 바다의 물 한 방울"에 불과한 금액입니다. 이 비교적 적은 투자는 윤리적 데이터 수집이 엄청나게 비싸다는 업계의 주장에 이의를 제기합니다.​

소니 AI의 사장인 Michael Spranger는 이번 출시를 "AI 데이터셋에 대한 새로운 업계 기준"을 확립하는 것으로 평가하며, "데이터를 책임감 있게 수집하는 것이 가능하다는 것을 증명하고, 처음부터 신뢰할 수 있는 AI를 구축하는 데 도움이 된다"고 말했습니다.​

FHIBE 데이터셋은 현재 fairnessbenchmark.ai.sony에서 공개적으로 이용 가능하며, 전 세계 연구자와 개발자에게 컴퓨터 비전 시스템의 편향을 식별하고 완화할 수 있는 도구를 제공합니다.

댓글 0
전체 1,366 / 106 페이지
(퍼플렉시티가정리한기사)구글딥마인드와구글리서치는11월17일WeatherNext2를공개했습니다.이는이전버전보다8배빠른예측을제공하고시간별해상도예보를제공하는고급AI날씨예측모델입니다.이모델은단일처리칩에서1분이내에수백가지의가능한날씨시나리오를생성할수있으며,이는기존슈퍼컴퓨터로는몇시간이걸리는작업입니다.​WeatherNext2는0일에서15일까지의예측리드타임에걸쳐온도,바람,습도를포함한99.9%의날씨변수에서구글의이전모델을능가합니다.이기술은이미구글검색,Gemini,PixelWeather,그리고구글맵스플랫폼의WeatherAPI에서날씨예보를지원하고있으며,앞으로몇주내에구글맵스에도통합될예정입니다.​향상된예측및비즈니스애플리케이션이모델은열대폭풍경로를최대3일전에예측하는데특히강점을보이며,이는이전버전보다하루개선된것입니다.DeepMindAI연구원AkibUddin에따르면,시간별예보는에너지거래자및기타산업에특히유용합니다.Uddin은Bloomberg와의인터뷰에서"더세밀한예보를제공합니다"라고말했습니다."많은다른산업들이이러한1시간단위에상당한관심을보이고있습니다.이를통해더정확한의사결정을할수있습니다".​이혁신은FunctionalGenerativeNetwork라는새로운접근방식에서비롯되었으며,이는온도나풍속과같은개별기상요소만으로모델을훈련시키지만,지역열파나풍력발전소출력과같은복잡하게상호연결된시스템을예측할수있게합니다.​한계점및경쟁환경발전에도불구하고,DeepMind연구과학자FerranAlet은훈련데이터의공백으로인해이모델이이상치강우및강설사건을예측하는데어려움을겪을가능성이있다고인정했습니다."이것은우리예보의한가지한계이지만,우리가개선하기위해노력하고있는부분입니다"라고Alet은Bloomberg에말했습니다.​WeatherNext2는현재GoogleCloudVertexAI,BigQuery,EarthEngine을통해기업과연구자들에게제공되고있습니다.이모델은,,AccuWeather,Huawei를포함한회사들이모두AI기반기상예보시스템을개발하고있는점점더경쟁적인분야에진입했습니다.
870 조회
0 추천
2025.11.18 등록
(퍼플렉시티가정리한기사)일론머스크의출시한지한달된위키피디아대체서비스인그로키피디아(Grokipedia)가수천개의"의심스러운"그리고"문제가있는"출처를인용하고있어AI기반백과사전의신뢰성에대한심각한의구심을불러일으키고있다고코넬테크연구진이금요일발표한연구결과가밝혔다.​연구에따르면위키피디아에서복사되지않은그로키피디아문서는영어위키피디아커뮤니티에서"일반적으로신뢰할수없는"것으로간주되는출처를인용할가능성이3.2배더높고,위키피디아가완전히차단하는"블랙리스트"출처를포함할가능성이13배더높은것으로나타났다.인용중에는스톰프론트(Stormfront)와인포워즈(InfoWars)를포함한극우매체에대한수십건의참조가포함되어있다.​코넬테크연구진인해롤드트리드먼(HaroldTriedman)과알렉시오스만차를리스(AlexiosMantzarlis)는보고서에서"그로키피디아에서는출처관련안전장치가대부분제거된것이분명하다"고썼다."이로인해의심스러운출처가포함되고,잠재적으로문제가있는출처의전반적인비율이더높아지게된다."​논란속에출범한위키백과경쟁서비스머스크의회사xAI는10월27일80만개이상의AI생성기사를담은그로키피디아를출시하며,머스크가"위키피디아보다엄청난개선"이라고부른것으로포지셔닝했다.이억만장자는오랫동안위키피디아를좌파편향이라고비난해왔으며,이를"Wokepedia"라고부르고작년에2억명이상의X팔로워들에게비영리단체에기부를중단할것을촉구했다.​그러나이플랫폼은정확성문제로빠르게비판을받았다.PolitiFact는그로키피디아가존재하지않는출처를인용하거나참조된정보를포함하지않는출처를인용하는등허위인용을자주만들어낸다는것을발견했다.한사례에서,백과사전은파이스트의아버지가2021년에사망했다는Vice기사를인용했는데,실제기사는2017년것이었고사망에대한언급이없었으며당시그녀의아버지는여전히살아있었다.​위키피디아공동창립자지미웨일스는이프로젝트를일축하며CNBC에대규모언어모델이"대규모오류"를만들어낼것이라고말했다."저는그로키피디아를철저히검토할기회가없었고,흥미롭게생각하지만,일론머스크의탁월함에대한찬사로가득차있는것같습니다"라고웨일스는말했다.​투명성격차와이념적우려공개편집을허용하고변경사항과출처에대한상세한기록을유지하는위키백과와달리,그로키피디아는기사가AI로생성되었다는점을인정하는것외에는기사작성방법에대한어떠한통찰도제공하지않습니다.사용자는양식을통해피드백을제출할수는있지만항목을직접편집할수는없습니다.​이플랫폼은논란의여지가있는주제를다루는방식으로특히면밀한조사를받았습니다.한분석에따르면,그로키피디아의1월6일국회의사당공격에대한항목은사건자체보다언론보도에대한이의제기에더초점을맞추고있습니다.이백과사전에는또한InfoWars를인용하는"클린턴시체수"음모론을홍보하는기사도포함되어있습니다.​코넬공대연구결과에대한논평요청을받았을때,xAI는"레거시미디어는거짓말을한다(LegacyMediaLies)"라는자동응답을보냈습니다.목요일,머스크는그로키피디아가"충분히좋아지면(아직갈길이멀지만)""은하백과사전(EncyclopediaGalactica)"으로브랜드를변경할계획이라고발표했습니다.
903 조회
0 추천
2025.11.18 등록
(퍼플렉시티가정리한기사)AI에이전트시스템의보안취약점을해결하는새로운스타트업이월요일1,100만달러의시드펀딩과이미계약을체결한8개의유니콘고객사를확보하며출범했습니다.세번째창업에나선앤드류버먼(AndrewBerman)이설립한Runlayer는AI에이전트가기업데이터및시스템과상호작용할수있도록하는새로운표준인모델컨텍스트프로토콜(ModelContextProtocol)에대한포괄적인보안을구축하기위해KhoslaVentures의키스라보이스(KeithRabois)와Felicis로부터투자를확보했습니다.​이회사는제품출시후불과4개월만에스텔스모드에서벗어났으며,이미Gusto,Rippling,dbtLabs,Instacart,Opendoor,Ramp를포함한수십개의고객사와계약을체결했습니다.Runlayer는또한Anthropic에서MCP의수석개발자인데이비드소리아파라(DavidSoriaParra)를엔젤투자자및고문으로영입했습니다.​보안침해가긴급한필요성을촉진하다2024년11월Anthropic이오픈소스로출시한ModelContextProtocol(MCP)은AI에이전트가인간의감독없이데이터에접근하고이동시키며변경할수있게해주는사실상의표준이되었습니다.OpenAI,Microsoft,AmazonWebServices,Google을비롯한주요모델제작사뿐만아니라수천개의기술기업들이이제이프로토콜을지원하고있습니다.​그러나MCP는본질적으로내장된보안기능이부족하여,실제배포된구현들에서여러취약점이발견되었습니다.2025년5월InvariantLabs의연구원들은MCP서버에서프롬프트인젝션취약점을발견했으며,이를통해무단으로비공개GitHub저장소에접근할수있었습니다.이듬달에는Asana가자사의MCP서버에서서로다른조직간의고객데이터가누출될수있는취약점을발견하고이를수정했습니다.​TechCrunch에따르면이러한보안문제들로인해Cloudflare,Docker,Wiz를비롯한여러회사들이다양한MCP보안제품을출시하게되었습니다.​올인원플랫폼접근방식Runlayer는단일솔루션이아닌종합적인보안을제공함으로써붐비는시장에서차별화를추구하고있습니다.이플랫폼은게이트웨이보안과모든MCP요청을분석하는위협탐지,허가된MCP서버전반의관찰성모니터링,맞춤형AI자동화를구축할수있는엔터프라이즈개발도구,그리고Okta와같은신원제공자와통합되는세분화된권한기능을결합합니다.​과거유아용모니터제조업체인Nanit와AI영상회의툴Vowel을설립했던버먼은2024년3월Vowel을매각한뒤Zapier의AI디렉터가되었습니다.그는Zapier에서최초의MCP서버중하나를구축하면서OpenAI및Anthropic과긴밀히협력했습니다.이후2025년8월,공동창업자인탈페레츠,비토르발로코와함께Zapier를떠나Runlayer를설립했습니다.
966 조회
0 추천
2025.11.18 등록
(퍼플렉시티가정리한기사)Helldivers2개발사ArrowheadGameStudios의CEO는ArcRaiders에서AI생성음성을논란의여지가있게사용한것을옹호하며,게임업계가인공지능에대해극단적인입장을취하기보다는"중간지점"을찾아야한다고주장했습니다.ShamsJorjani의이러한발언은Eurogamer가ArcRaiders에별5개중2개만부여한후나왔으며,낮은점수는주로이추출슈터게임의AI텍스트음성변환기술구현때문이었습니다.이리뷰는게임이400만장이상판매되는상업적성공을거두었음에도불구하고게임의종합Metacritic점수를떨어뜨렸습니다.​"어쩌면,그럴수도있지않을까요,현실은그중간어딘가에있지않을까요?그럴수도있지않을까요?"Jorjani는TheGameBusinessShow와의인터뷰에서말했습니다."저는사람들이극단적인견해로뛰어든다는것을알게됩니다."​성우들이보수를받은후복제됨Nexon소유의ArcRaiders개발사EmbarkStudios는추가대사를생성하는AI모델학습에자신의목소리를사용하는데동의한성우들을고용했습니다.이시스템은아이템이름,위치,나침반방향에대한음성대사를생성하며,새로운콘텐츠가추가될때마다배우들이스튜디오에돌아올필요가없습니다.​Jorjani는이접근방식을칭찬하며,자신은개인적으로멀티플레이어게임에서음성채팅을피한다고언급했습니다."이것이더많은사람들이서로소통할수있게해주며,궁극적으로게임에좋은일이라고생각합니다"라고그는말했습니다."사람들이자신의작업에대해보상받을수있도록하기만하면됩니다.분명히중간지점이있을것입니다."​ArrowheadCEO는자신의스튜디오가게임자체에는AI를사용하지않지만,관리업무를위한효율성도구로는활용한다고명확히했습니다."우리는게임에AI를넣지않지만,영수증처리를더빨리할수있게해준다면,그것은모두를위한더많은Helldivers를의미합니다"라고그는말했습니다.​업계전반의긴장이논쟁은주요퍼블리셔들이AI사용을확대함에따라더광범위한긴장을반영합니다.SquareEnix는최근2027년말까지품질보증및디버깅작업의70%를자동화하겠다는계획을발표했습니다.Krafton은10월에직원들을위한자발적사직프로그램을포함하는"AI우선"방침을시작했습니다.Microsoft소유의Activision은CallofDuty:BlackOps7에서AI로생성된콜링카드아트워크로인해반발에직면했습니다.​한편,PUBG크리에이터BrendanGreene은Eurogamer에"커뮤니티가AI관련사안에반발하는것을보고정말힘을얻었다"고말했으며,이는스튜디오들이효율성향상과창의적무결성및인력문제사이에서균형을맞추려는가운데업계의이념적분열을강조합니다.​
875 조회
0 추천
2025.11.18 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입