AI 뉴스

소니, 모델 전반의 편향성을 드러내는 윤리적 AI 데이터셋 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.06 14:04
1,072 조회
0 추천
0 비추천

본문

2192245744_rlcnht.jpg

(퍼플렉시티가 정리한 기사)


소니 AI는 화요일에 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 획기적인 동의 기반 데이터셋인 Fair Human-Centric Image Benchmark (FHIBE)를 출시했습니다. Nature에 게재된 이번 출시는 AI 시스템 전반의 공정성을 평가하기 위해 특별히 제작된 최초의 공개적으로 이용 가능한 전 세계적으로 다양한 데이터셋을 나타내며, 기존 모델 중 윤리적 기준을 완전히 충족하는 것은 없다는 사실을 밝혀냅니다.​

이 데이터셋은 81개국에서 온 1,981명의 자원자들의 10,318개 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받고 수집되었습니다. 참가자들은 언제든지 자신의 이미지를 철회할 권리를 보유하며, 이는 허가 없이 웹 데이터를 수집하는 업계 관행에서 벗어난 것입니다.​


AI 모델 전반에 걸쳐 광범위한 편향성 발견

Sony AI의 테스트는 현재 컴퓨터 비전 시스템에서 "she/her/hers" 대명사를 사용하는 개인에 대한 정확도가 낮은 것을 포함하여 지속적인 편향이 존재함을 밝혀냈습니다. 벤치마크는 이러한 격차가 부분적으로 해당 인구 집단의 더 큰 헤어스타일 다양성에서 비롯된다는 것을 확인했는데, 이는 공정성 연구에서 이전에 간과되었던 요인입니다.​

모델이 직업에 대한 중립적인 질문을 받았을 때 더 우려스러운 패턴이 나타났습니다. AI 시스템은 인구통계학적 특성에 기반하여 대상을 성 노동자, 마약 거래상 또는 도둑으로 묘사하면서 해로운 고정관념을 자주 강화했습니다. 범죄 활동에 대해 질문을 받았을 때, 모델은 아프리카계 또는 아시아계 조상을 가진 개인, 더 어두운 피부톤을 가진 사람, 그리고 "he/him/his"로 식별되는 사람들에 대해 더 높은 비율로 유해한 응답을 생성했습니다.​

Sony AI의 연구에 따르면, "기존의 대규모 언어 모델 중 FHIBE의 모든 공정성 테스트를 통과한 것은 없었으며, 이는 AI의 내재된 편향과 포용성 부족이 여전히 지속적인 문제로 남아 있음을 보여줍니다".​


새로운 업계 표준 설정

소니 그룹의 글로벌 AI 거버넌스 책임자인 Alice Xiang은 오랜 업계 관행을 해결하는 데 있어 이 데이터셋의 중요성을 강조했습니다. "업계는 너무 오랫동안 다양성이 부족하고, 편향을 강화하며, 적절한 동의 없이 수집된 데이터셋에 의존해 왔습니다"라고 그녀는 말했습니다. "이 프로젝트는 사전 동의, 개인정보 보호, 공정한 보상, 안전, 다양성 및 유용성에 대한 모범 사례를 통합한 책임 있는 데이터 수집이 가능하다는 것을 보여줍니다."​

개발 비용은 3년 동안 100만 달러 미만이었으며, Nature의 사설 보도에 따르면 "많은 기술 기업들에게는 바다의 물 한 방울"에 불과한 금액입니다. 이 비교적 적은 투자는 윤리적 데이터 수집이 엄청나게 비싸다는 업계의 주장에 이의를 제기합니다.​

소니 AI의 사장인 Michael Spranger는 이번 출시를 "AI 데이터셋에 대한 새로운 업계 기준"을 확립하는 것으로 평가하며, "데이터를 책임감 있게 수집하는 것이 가능하다는 것을 증명하고, 처음부터 신뢰할 수 있는 AI를 구축하는 데 도움이 된다"고 말했습니다.​

FHIBE 데이터셋은 현재 fairnessbenchmark.ai.sony에서 공개적으로 이용 가능하며, 전 세계 연구자와 개발자에게 컴퓨터 비전 시스템의 편향을 식별하고 완화할 수 있는 도구를 제공합니다.

댓글 0
전체 1,366 / 113 페이지
(퍼플렉시티가정리한기사)Ubisoft은도시건설게임의11월13일출시직후며칠만에Anno117:PaxRomana에서발견된AI생성아트워크문제를신속히해결하기위해나섰으며,팬들이프랜차이즈의수작업예술성전통을배신했다고말하는논란이된이미지를교체하겠다고약속했다.​플레이어들은고대로마를묘사한로딩화면과배경일러스트에서손가락이없는왜곡된손,머리없는인물,흐릿하고부자연스러운캐릭터렌더링등AI생성의명백한징후를발견했다.이발견은특히비평가들의찬사를받은Anno1800을비롯해시리즈의세밀한아트워크를오랫동안높이평가해온Anno커뮤니티에큰충격을주었다.​"플레이스홀더"설명에대한의문제기Kotaku에대한성명에서Ubisoft는기형적인인물들이있는연회장면을보여주는가장심각한이미지가"의도치않게검토과정을통과한임시자산"이라고주장했다.퍼블리셔는다가오는1.3패치에서대체이미지를제공하겠다고약속하면서,Anno117이"프랜차이즈역사상최대규모의아티스트팀"을고용했다고언급했다.​그러나회사가공유한수정된아트워크는원본과매우유사하게보여,관찰자들은Ubisoft가단순히가장명백한AI흔적들을덧칠한것은아닌지의문을제기했다.Reddit사용자AlcoreRain은"이것은그들이아트의기반으로AI를사용했다는것을보여주며,이그림은1800과같은수준이아니다.그들이게임에서저렴한도구를사용할거라면,나는게임이저렴해질때까지기다릴것이다"라고썼다.또다른팬은"모든비디오게임중에서,Anno는안돼!!나를Anno1800으로끌어들인것은그것의아름다운아트워크였다"라고한탄했다.​플레이어들은또한게임내AI로생성된것으로추정되는언어현지화에대한우려를제기했다.​더광범위한산업트렌드의일부Anno117은2024년1월Valve이시행한요구사항인AI콘텐츠공개와함께출시된Ubisoft의첫Steam릴리스를의미합니다.공개내용에따르면일부자산을제작하는데AI도구가사용되었지만,"최종제품은우리팀의기술과창의적비전을반영합니다"라고명시되어있습니다.​이논란은주요게임출시에서AI사용에대한감시가강화되는가운데발생했습니다.며칠앞서출시된CallofDuty:BlackOps7은여섯손가락을가진손과같은특징적인결함이있는스튜디오지브리스타일의아트워크를특징으로하는AI생성콜링카드로인해광범위한비판에직면했습니다.10월30일에출시된EmbarkStudios의ArcRaiders는AI음성연기를사용하여반발을샀습니다.​​2025년중반기준으로,새로운Steam릴리스5개중거의1개가생성형AI사용을공개하고있으며,이는전년대비거의700%증가한수치입니다.Steam라이브러리의7%에해당하는7,818개타이틀이현재AI공개를포함하고있습니다.
916 조회
0 추천
2025.11.17 등록
(퍼플렉시티가정리한기사)인공지능코딩도우미는소프트웨어엔지니어들이업무에접근하는방식을근본적으로재편하고있지만,많은사람들이예상했던방식과는다릅니다.11월15일TechRadar에기고한Chronosphere의CTO이자공동창립자인RobSkillington에따르면,AI는워크플로우이상을변화시키고있으며,커리어경로를바꾸고개발자들이자신의역할을완전히재정의하도록강요하고있습니다.​비영리AI연구그룹METR의최근무작위대조시험에서는AI도구를사용하는숙련된오픈소스개발자들이AI지원없이작업할때보다실제로작업완료에19%더오래걸린다는것을발견했습니다.이는참가자와전문가모두약40%의속도향상을예측했던연구전기대와모순됩니다.​METR연구원들에따르면,속도저하는개발자들이AI에프롬프트를입력하고,생성된제안을검토하고,복잡한코드베이스와출력물을통합하는데시간을소비하는데서비롯됩니다.실패율중60%는AI도구로인해발생하며,여기에는처음에는수용가능해보이지만면밀히검토하면상당한수정이필요한"버그가있는"코드가포함됩니다.​순환적디버깅문제AI코딩에이전트는코드작성시추가적인아이디어레이어를제공하지만,종종자신의코드를수정하려는순환적시도에갇히곤합니다.이는특히AI가어려움을겪는코드를수정하고재구현할때,전문화된코드베이스나비정형적인맥락에서작업할때더높은수준의지도가필요합니다.​이러한어려움에도불구하고,AI코딩에이전트는개선되고있습니다.최신도구들은이제자신이작성한코드에대해테스트를빌드하고실행하며자체적으로오류를수정하여,기술초기단계에비해환각(hallucination)문제가덜한편입니다.​MCP서버를통한DevOps혁신떠오르는밝은영역중하나는사이트신뢰성엔지니어링입니다.Cursor및ClaudeCode와같은AI코딩도구와통합되는ModelContextProtocol서버를사용함으로써엔지니어들은일상적인DevOps워크플로우에AI를쉽게통합할수있습니다.MCP서버는텔레메트리데이터를AI에제공하여AI가데이터를분석하고수동입력을제거할수있게하며,이는효율성을향상시키고환각을줄입니다.​이를통해사이트신뢰성엔지니어들은몰입상태를유지하면서서비스수준목표의상태를신속하게평가하고,로그를수집하며,서비스의오류및지연시간분포를관찰할수있습니다.업계보고서에따르면,이러한통합은일부팀이사고해결시간을몇시간에서몇분으로단축하는데도움이되었습니다.​AI가시간을절약하는지낭비하는지는작업의복잡성,엔지니어의경험수준,그리고AI를효과적으로프롬프트하는능력에달려있습니다.Skillington이언급했듯이,궁극적으로"인간이지원하는AI가가장강력한AI가될것"입니다.
1016 조회
0 추천
2025.11.17 등록
(퍼플렉시티가정리한기사)일본의연구자들이1,000억개이상의개별별들을추적하는최초의은하수은하시뮬레이션을달성했으며,이는인공지능과슈퍼컴퓨팅능력을결합하여이룬성과입니다.이번주세인트루이스에서열린SC'25슈퍼컴퓨팅컨퍼런스에서발표된이시뮬레이션은10,000년의은하진화를모델링하며이전방법보다100배빠르게실행됩니다.​RIKEN학제간이론및수리과학센터의KeiyaHirashima가이끄는일본과스페인의국제팀은천체물리학자들을오랫동안좌절시켜온문제를해결했습니다:초신성폭발과같은빠른항성현상을포착하면서전체은하를정확하게시뮬레이션하는것.​계산장벽돌파하기이전의최첨단시뮬레이션은대략10억개의태양질량에해당하는은하를처리할수있었는데,이는우리은하의실제항성개체군보다100배작은규모였습니다.기존의물리기반접근방식으로는은하진화의백만년마다315시간이소요되었으며,이는10억년시뮬레이션을완료하는데36년이상이걸린다는것을의미했습니다.​돌파구는고해상도초신성시뮬레이션으로훈련된딥러닝대리모델을통해마련되었습니다.이AI구성요소는초신성폭발이후10만년동안가스가팽창하는방식을예측하는방법을학습하여,정확도를유지하면서계산비용이많이드는작은타임스텝을우회할수있게했습니다.RIKEN의Fugaku슈퍼컴퓨터와도쿄대학교의Miyabi시스템에걸쳐700만개의CPU코어를사용하여,연구팀은시뮬레이션시간을백만년당단2.78시간으로단축했으며,이를통해10억년예측을약115일만에가능하게했습니다.​별너머의영향들Hirashima에따르면,이방법론은천체물리학을훨씬넘어서는범위로확장된다."AI와고성능컴퓨팅의통합은계산과학전반에걸쳐다중스케일,다중물리문제를해결하는방식의근본적인변화를나타냅니다"라고그는말하며,기후모델링,기상예측,해양학과같이소규모프로세스와대규모프로세스를연결하는것이유사한계산과제를제기하는분야에서의응용을언급했다.​이시뮬레이션은연구자들이생명에필수적인원소들이은하내에서어떻게출현했는지추적할수있게하며,지구와같은행성을가능하게만든화학적진화를잠재적으로조명한다.
945 조회
0 추천
2025.11.17 등록
(퍼플렉시티가정리한기사)무협액션RPG《WhereWindsMeet》는11월14일글로벌출시후24시간만에163,523명의동시접속자를기록하며Steam을강타했지만,AI챗봇NPC사용이투명성과게임개발에서인공지능의역할에대한열띤논쟁을불러일으켰다.​EverstoneStudio와NetEaseGames의무료플레이게임은플레이어가텍스트입력또는음성입력을통해AI기반챗봇으로특정NPC와대화할수있는"강호친구(JianghuFriends)"시스템을제공한다.이러한AI상호작용은게임내에서표시되지만,Steam스토어페이지에는해당기술이공개되지않았으며,이는소셜미디어플랫폼에서비판을촉발시킨사실이다.​플레이어반응은재미와우려사이에서갈리다출시이후,플레이어들은AINPC를조종하여게임의역사적배경을무너뜨리는터무니없는대화를나눌수있다는것을발견했습니다.Reddit유저MisterZan25는NPC조다리(ZhaoDali)에게자신의캐릭터가그의아이를임신했다고설득하여양육비를요구한다음,아이가죽었다고주장한일화를게시했습니다.다른유저인Immediate-Molasses-5는같은NPC에게케첩과감자로요리하는것에대해물어봤고,AI는"송나라시대에는케첩을구할수없었다"고인정하는답변을했습니다.​"WhereWindsMeet을다운로드하려고했는데AI챗봇NPC에대해알게됐어요,"Bluesky유저rynegaia가토요일에작성했습니다."우리는지옥에있군요".​다른사람들은이기능에대해재미있어했습니다.한플레이어는"술취한남자와랩을하느라너무많은시간을보낸것을즐겁게인정했고,"다른플레이어는"요리사를비건으로만들려고시도했으며""나무꾼을위한광고전략을개발했다"고PCGamesN이보도했습니다.​투명성과윤리적우려Steam스토어페이지의공개부족이핵심비판으로떠올랐습니다."게임플레이에크게해롭지는않지만(이러한종류의NPC를완전히피할수있음)WhereWindsMeet에AI챗봇을포함시킨것은궁극적으로실제인간의작업가치를떨어뜨리는AI지원게임개발노력을정상화하려는지속적인시도를나타냅니다"라고PCGamesN이보도했습니다.​논란에도불구하고,이게임은출시후첫12시간동안"복합적"평가에서상승한후Steam에서"대체로긍정적"평가를유지하고있습니다.이타이틀은11월16일에193,860명의동시접속자최고치를기록했으며,무료플레이출시치고는강력한유지율을보여주고있습니다.​NetEaseGames는Steam스토어공개나AI구현에대한논평요청에즉시응답하지않았습니다.
880 조회
0 추천
2025.11.17 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입