AI 뉴스

소니, 모델 전반의 편향성을 드러내는 윤리적 AI 데이터셋 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.06 14:04
1,077 조회
0 추천
0 비추천

본문

2192245744_rlcnht.jpg

(퍼플렉시티가 정리한 기사)


소니 AI는 화요일에 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 획기적인 동의 기반 데이터셋인 Fair Human-Centric Image Benchmark (FHIBE)를 출시했습니다. Nature에 게재된 이번 출시는 AI 시스템 전반의 공정성을 평가하기 위해 특별히 제작된 최초의 공개적으로 이용 가능한 전 세계적으로 다양한 데이터셋을 나타내며, 기존 모델 중 윤리적 기준을 완전히 충족하는 것은 없다는 사실을 밝혀냅니다.​

이 데이터셋은 81개국에서 온 1,981명의 자원자들의 10,318개 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받고 수집되었습니다. 참가자들은 언제든지 자신의 이미지를 철회할 권리를 보유하며, 이는 허가 없이 웹 데이터를 수집하는 업계 관행에서 벗어난 것입니다.​


AI 모델 전반에 걸쳐 광범위한 편향성 발견

Sony AI의 테스트는 현재 컴퓨터 비전 시스템에서 "she/her/hers" 대명사를 사용하는 개인에 대한 정확도가 낮은 것을 포함하여 지속적인 편향이 존재함을 밝혀냈습니다. 벤치마크는 이러한 격차가 부분적으로 해당 인구 집단의 더 큰 헤어스타일 다양성에서 비롯된다는 것을 확인했는데, 이는 공정성 연구에서 이전에 간과되었던 요인입니다.​

모델이 직업에 대한 중립적인 질문을 받았을 때 더 우려스러운 패턴이 나타났습니다. AI 시스템은 인구통계학적 특성에 기반하여 대상을 성 노동자, 마약 거래상 또는 도둑으로 묘사하면서 해로운 고정관념을 자주 강화했습니다. 범죄 활동에 대해 질문을 받았을 때, 모델은 아프리카계 또는 아시아계 조상을 가진 개인, 더 어두운 피부톤을 가진 사람, 그리고 "he/him/his"로 식별되는 사람들에 대해 더 높은 비율로 유해한 응답을 생성했습니다.​

Sony AI의 연구에 따르면, "기존의 대규모 언어 모델 중 FHIBE의 모든 공정성 테스트를 통과한 것은 없었으며, 이는 AI의 내재된 편향과 포용성 부족이 여전히 지속적인 문제로 남아 있음을 보여줍니다".​


새로운 업계 표준 설정

소니 그룹의 글로벌 AI 거버넌스 책임자인 Alice Xiang은 오랜 업계 관행을 해결하는 데 있어 이 데이터셋의 중요성을 강조했습니다. "업계는 너무 오랫동안 다양성이 부족하고, 편향을 강화하며, 적절한 동의 없이 수집된 데이터셋에 의존해 왔습니다"라고 그녀는 말했습니다. "이 프로젝트는 사전 동의, 개인정보 보호, 공정한 보상, 안전, 다양성 및 유용성에 대한 모범 사례를 통합한 책임 있는 데이터 수집이 가능하다는 것을 보여줍니다."​

개발 비용은 3년 동안 100만 달러 미만이었으며, Nature의 사설 보도에 따르면 "많은 기술 기업들에게는 바다의 물 한 방울"에 불과한 금액입니다. 이 비교적 적은 투자는 윤리적 데이터 수집이 엄청나게 비싸다는 업계의 주장에 이의를 제기합니다.​

소니 AI의 사장인 Michael Spranger는 이번 출시를 "AI 데이터셋에 대한 새로운 업계 기준"을 확립하는 것으로 평가하며, "데이터를 책임감 있게 수집하는 것이 가능하다는 것을 증명하고, 처음부터 신뢰할 수 있는 AI를 구축하는 데 도움이 된다"고 말했습니다.​

FHIBE 데이터셋은 현재 fairnessbenchmark.ai.sony에서 공개적으로 이용 가능하며, 전 세계 연구자와 개발자에게 컴퓨터 비전 시스템의 편향을 식별하고 완화할 수 있는 도구를 제공합니다.

댓글 0
전체 1,366 / 136 페이지
(퍼플렉시티가정리한기사)월요일에발표된동료검토연구에따르면,생성형AI도구가조직의의사결정목표브레인스토밍에도움을줄수있지만인간의개입없이는불완전하고중복된결과를생성하며,이는복잡한분석작업에서AI의한계를강조한다.​AmericanUniversity의JaySimon과ManagementCenterInnsbruck의JohannesUlrichSiebert연구진은GPT-4o,Claude3.7,Gemini2.5,Grok-2가생성한목표세트를이전에발표된6개연구의전문의사결정분석가들이개발한것과비교했다.DecisionAnalysis저널에발표된연구결과는AI가개별적으로합리적인목표를자주생성했지만,전체적으로는완전성과일관성이부족했다고밝혔다.​"AI는무엇이중요할수있는지나열할수있지만,무엇이진정으로중요한지구별하는것은아직할수없다"고저자들은썼다.각AI생성세트는완전성,분해가능성,중복성을포함한가치중심사고의9가지기준으로평가되었다.이도구들은명시적으로피하라는지시에도불구하고"수단목표"를자주포함했다.​전문가검증필요가치중심사고의개척자인랄프키니(RalphKeeney)는AI가만든목록에대해"두목록모두대부분의개인이만들수있는것보다낫지만,"근본적인목표만을포함하지않는한어떤것도양질의의사결정분석에사용해서는안된다고언급했습니다.​연구진은결과개선을위해고급프롬프트전략을테스트했습니다.연쇄적사고(chain-of-thoughtreasoning)와전문가의비평-수정(critique-and-revise)방법을결합하자,AI의출력이상당히향상되어더욱집중적이고논리적으로구조화된목표집합이생성되었습니다.​"생성형AI는여러기준에서좋은성과를보입니다."라고사이먼(Simon)은말했습니다."하지만여전히일관성있고중복되지않는목표집합을생산하는데어려움을겪고있습니다.인간의사결정분석가가AI가산출하는결과를정제하고검증하는데필수적입니다".​AI협업에대한더광범위한시사점이연구는창의적이고분석적인작업에서AI의한계에대한증가하는증거와일치합니다.Wharton의11월연구에따르면ChatGPT가개별아이디어의질을향상시켰지만,그룹이더유사한아이디어를생성하도록하여혁신에필수적인다양성을감소시켰습니다.StanfordGraduateSchoolofBusiness의연구자들은또한인간의사결정자를염두에두고설계된알고리즘이순수하게예측적인시스템보다더나은성과를보인다는것을입증했습니다.​이연구는목표가필수적이고,분해가능하며,완전하도록보장하기위해AI브레인스토밍과전문가개선을통합한4단계하이브리드모델로결론을내립니다."우리의연구결과는GenAI가전문가의판단을대체하는것이아니라보강해야한다는것을분명히합니다"라고Siebert는말했습니다."인간과AI가함께작업할때,그들은더나은의사결정을위해서로의강점을활용할수있습니다".
1158 조회
0 추천
2025.11.13 등록
(퍼플렉시티가정리한기사)Amazon은2025년11월12일4세대EchoShow8스마트디스플레이를출시했으며,이는제품출시이후가장큰디자인변경이자회사의AlexaPlus대화형AI어시스턴트에대한조기액세스와함께출하되는첫번째제품입니다.​​새로운EchoShow8은더얇은베젤과이전쐐기모양모델에서벗어난플로팅디스플레이디자인을갖춘8.7인치HD터치스크린을특징으로합니다.179.99달러의가격으로책정된이기기는이전모델보다30달러인상되었지만AI가속기능을갖춘Amazon의맞춤형AZ3Pro칩으로구동되는업그레이드된내부사양이포함되어있습니다.​AlexaPlus,대화형AI를제공하다가장주목할만한추가기능은AlexaPlus로,깨우기단어를반복해서말하지않아도다회차대화가가능한Amazon의생성형AI기반어시스턴트입니다.Amazon에따르면,업그레이드된어시스턴트는정보를보다자연스럽게제공하고,이전대화의맥락을기억하며,레스토랑예약이나식료품주문과같은작업을완료할수있습니다.​AlexaPlus는일반사용자의경우월$19.99이지만AmazonPrime회원에게는무료입니다.얼리액세스기간에는EchoShow기기에우선제공되며,어시스턴트는점진적으로다른호환기기로확대됩니다.​Omnisense플랫폼이스마트홈기능을강화합니다EchoShow8은카메라,Wi-Fi레이더,온도센서,초음파를결합한Amazon의센서융합플랫폼인Omnisense를도입합니다.이기술은누군가방에들어오거나환경조건이변화할때루틴이작동하도록합니다.​이기기는비디오통화를위한자동프레이밍및3.3배줌기능을갖춘13메가픽셀카메라와함께,3세대대비2배의베이스를제공하는맞춤형2.8인치우퍼를특징으로하는업그레이드된오디오를포함합니다.또한Matter,Thread,Zigbee,Wi-Fi6E및Bluetooth5.3을지원하는스마트홈허브로도기능합니다.​프라이버시트레이드오프가우려를불러일으키다그러나아마존은이전EchoShow8모델에기본으로제공되던물리적카메라셔터를제거하고,대신전자식카메라및마이크제어방식을선택했습니다.이러한변경은렌즈위의물리적커버를선호했던프라이버시옹호자들로부터비판을받았습니다.​아마존은또한EchoShow8과함께EchoShow11을출시했으며,이제품은10.95인치FullHD디스플레이를탑재하고$219.99의가격으로판매됩니다.두기기모두현재AlexaPlus얼리액세스가포함되어구매가능합니다.
1043 조회
0 추천
2025.11.13 등록
(퍼플렉시티가정리한기사)오늘RoyalSocietyOpenScience에발표된연구에따르면,짧은훈련세션만으로도사람들의AI생성가짜얼굴식별능력이극적으로향상될수있다고합니다.Reading,Greenwich,Leeds,Lincoln대학의과학자들은단5분간의교육만으로도뛰어난얼굴인식능력을가진개인들의탐지정확도가20%포인트이상증가했다는것을발견했습니다.​이연구는664명의참가자를대상으로실제인간얼굴과가장진보된얼굴생성시스템중하나인StyleGAN3로생성된얼굴을구별하는능력을테스트했습니다.훈련없이는얼굴인식테스트에서평균보다훨씬높은점수를받는사람들인"슈퍼인식자"조차도가짜얼굴을41%의확률로만올바르게식별했으며,일반적인능력을가진참가자들은겨우31%만식별했습니다.두그룹모두무작위추측으로기대되는50%보다낮은성과를보였습니다.​간단한훈련이결과를낳는다비정상적인머리카락패턴과잘못된치아개수와같은일반적인컴퓨터렌더링실수를강조하는5분간의교육세션후,탐지율이상당히향상되었다.슈퍼인식자들은64%의정확도를달성했으며,일반참가자들은51%에도달했다.​레딩대학교의수석연구원인KatieGray박사는"컴퓨터로생성된얼굴은실질적인보안위험을초래한다"고말했다."이들은가짜소셜미디어프로필을만들고,신원확인시스템을우회하며,위조문서를생성하는데사용되어왔다.우리의교육절차는간단하고실행하기쉽다."​감지의증가하는도전연구결과에따르면사람들은실제인간얼굴보다AI가생성한얼굴을더사실적이라고판단하는경우가많은것으로나타났습니다.훈련은슈퍼인식자와일반관찰자모두에게동일한영향을미쳤으며,이는슈퍼인식자가단순히렌더링오류를더잘발견하는것이아니라합성얼굴을식별할때다른시각적단서를사용할수있음을시사합니다.​이연구에서StyleGAN3를사용한것은이전소프트웨어를사용한초기연구와비교했을때도전과제였으며,참가자들은이전연구보다성능이낮은경향을보였습니다.향후연구에서는훈련효과가시간이지나도지속되는지,그리고슈퍼인식자의능력이인공지능탐지도구를어떻게보완할수있는지를조사할예정입니다.​연구결과는짧은훈련과슈퍼인식자의타고난능력을결합하면온라인신원확인과같은실제문제를해결하는데도움이될수있음을시사하며,점점더정교해지는합성얼굴에대한실용적인인간방어수단을제공합니다.
1076 조회
0 추천
2025.11.13 등록
(퍼플렉시티가정리한기사)Google는2025년10월Gmail,Chat,Meet전반에걸쳐GeminiAI어시스턴트를비밀리에활성화하여명시적동의없이사용자의개인통신에접근할수있도록했다는혐의로제기된집단소송제안에직면하고있습니다.캘리포니아산호세연방법원에화요일늦게제출된이소장은,Google이이전에AI기능을선택적도구로제공했다가통신플랫폼전반에걸쳐Gemini를은밀하게활성화함으로써캘리포니아사생활침해방지법을위반했다고이기술대기업을고발하고있습니다.Thelev.GoogleLLC(25-cv-09704)라는제목의이사건은손해배상과Google이명시적승인없이Gemini를사용하여사용자통신을수집하는것을방지하기위한금지명령을요구하고있습니다.​숨겨진데이터수집의혹소송에따르면,구글의10월출시로Gemini는모든이메일,첨부파일,채팅메시지,화상통화녹취록을포함한사용자의전체커뮤니케이션기록에대한광범위한접근권한을얻었습니다.소송은구글이기술적으로사용자가이기능을비활성화할수있도록허용하지만,옵트아웃절차는Gemini가기본적으로활성화되었다는알림없이여러숨겨진개인정보설정을탐색해야한다고주장합니다.​소장은"사용자가그러한조치를취하지않는한,구글은Gemini를사용하여Gmail계정에서송수신된모든이메일과첨부파일을포함한사용자의개인커뮤니케이션의전체기록된이력에접근하고이를악용한다"고명시하고있습니다.​소송은이러한접근방식이관련된모든당사자의동의없이기밀통신을몰래녹음하는것을금지하는1967년캘리포니아법령을위반하는"비밀데이터수집"에해당한다고주장합니다.​기술거대기업들에대한프라이버시우려증가이번소송은주요기술기업들이AI를소비자제품에통합하는방식에대한감시가강화되는가운데제기되었습니다.올해초,JPMorganCEO제이미다이먼은고객데이터공유에대한우려로인해구글의제미나이통합을중단한것으로전해졌으며,이는암호화폐거래소제미나이공동창업자타일러윙클보스에따른것입니다.​구글은아직이러한주장에대해공식적인답변을발표하지않았습니다.2025년11월4일에업데이트된회사의개인정보보호문서에따르면,GoogleWorkspace의제미나이는고객데이터를기밀로유지하도록설계되었으며,상호작용은조직내에머물고콘텐츠는허가없이AI훈련에사용되지않습니다.​개인정보보호전문가들은이사건이지금까지의AI개인정보보호소송중가장중요한사건중하나가될수있으며,기술회사들이AI어시스턴트를배포하는방식에변화를강제하고AI기반도구의동의요구사항에대한선례를확립할가능성이있다고말합니다.
1009 조회
0 추천
2025.11.13 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입