AI 뉴스

소니, 모델 전반의 편향성을 드러내는 윤리적 AI 데이터셋 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.06 14:04
1,635 조회
0 추천
0 비추천

본문

2192245744_rlcnht.jpg

(퍼플렉시티가 정리한 기사)


소니 AI는 화요일에 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 획기적인 동의 기반 데이터셋인 Fair Human-Centric Image Benchmark (FHIBE)를 출시했습니다. Nature에 게재된 이번 출시는 AI 시스템 전반의 공정성을 평가하기 위해 특별히 제작된 최초의 공개적으로 이용 가능한 전 세계적으로 다양한 데이터셋을 나타내며, 기존 모델 중 윤리적 기준을 완전히 충족하는 것은 없다는 사실을 밝혀냅니다.​

이 데이터셋은 81개국에서 온 1,981명의 자원자들의 10,318개 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받고 수집되었습니다. 참가자들은 언제든지 자신의 이미지를 철회할 권리를 보유하며, 이는 허가 없이 웹 데이터를 수집하는 업계 관행에서 벗어난 것입니다.​


AI 모델 전반에 걸쳐 광범위한 편향성 발견

Sony AI의 테스트는 현재 컴퓨터 비전 시스템에서 "she/her/hers" 대명사를 사용하는 개인에 대한 정확도가 낮은 것을 포함하여 지속적인 편향이 존재함을 밝혀냈습니다. 벤치마크는 이러한 격차가 부분적으로 해당 인구 집단의 더 큰 헤어스타일 다양성에서 비롯된다는 것을 확인했는데, 이는 공정성 연구에서 이전에 간과되었던 요인입니다.​

모델이 직업에 대한 중립적인 질문을 받았을 때 더 우려스러운 패턴이 나타났습니다. AI 시스템은 인구통계학적 특성에 기반하여 대상을 성 노동자, 마약 거래상 또는 도둑으로 묘사하면서 해로운 고정관념을 자주 강화했습니다. 범죄 활동에 대해 질문을 받았을 때, 모델은 아프리카계 또는 아시아계 조상을 가진 개인, 더 어두운 피부톤을 가진 사람, 그리고 "he/him/his"로 식별되는 사람들에 대해 더 높은 비율로 유해한 응답을 생성했습니다.​

Sony AI의 연구에 따르면, "기존의 대규모 언어 모델 중 FHIBE의 모든 공정성 테스트를 통과한 것은 없었으며, 이는 AI의 내재된 편향과 포용성 부족이 여전히 지속적인 문제로 남아 있음을 보여줍니다".​


새로운 업계 표준 설정

소니 그룹의 글로벌 AI 거버넌스 책임자인 Alice Xiang은 오랜 업계 관행을 해결하는 데 있어 이 데이터셋의 중요성을 강조했습니다. "업계는 너무 오랫동안 다양성이 부족하고, 편향을 강화하며, 적절한 동의 없이 수집된 데이터셋에 의존해 왔습니다"라고 그녀는 말했습니다. "이 프로젝트는 사전 동의, 개인정보 보호, 공정한 보상, 안전, 다양성 및 유용성에 대한 모범 사례를 통합한 책임 있는 데이터 수집이 가능하다는 것을 보여줍니다."​

개발 비용은 3년 동안 100만 달러 미만이었으며, Nature의 사설 보도에 따르면 "많은 기술 기업들에게는 바다의 물 한 방울"에 불과한 금액입니다. 이 비교적 적은 투자는 윤리적 데이터 수집이 엄청나게 비싸다는 업계의 주장에 이의를 제기합니다.​

소니 AI의 사장인 Michael Spranger는 이번 출시를 "AI 데이터셋에 대한 새로운 업계 기준"을 확립하는 것으로 평가하며, "데이터를 책임감 있게 수집하는 것이 가능하다는 것을 증명하고, 처음부터 신뢰할 수 있는 AI를 구축하는 데 도움이 된다"고 말했습니다.​

FHIBE 데이터셋은 현재 fairnessbenchmark.ai.sony에서 공개적으로 이용 가능하며, 전 세계 연구자와 개발자에게 컴퓨터 비전 시스템의 편향을 식별하고 완화할 수 있는 도구를 제공합니다.

댓글 0
전체 1,366 / 33 페이지
• OpenAI는 Apple Music이 ChatGPT와 통합되어 사용자가 자연어 프롬프트를 통해 재생목록을 만들고 음악 추천을 받을 수 있게 될 것이라고 간략히 발표했으나, 이후 애플리케이션 CEO Fidji Simo의 게시물에서 해당 내용을 삭제했다.• 이 통합은 10월에 출시된 ChatGPT의 기존 Spotify 기능과 유사하게 작동하여, 사용자가 “Apple Music, 운동용 재생목록 만들어줘”와 같은 프롬프트로 대화를 시작하여 재생목록을 생성할 수 있게 한다.• 수정된 발표는 시기상조의 공개를 시사하며, OpenAI의 확장되는 앱 생태계의 일부로 음악 스트리밍 기능이 언제 출시될지에 대한 공식 일정은 제공되지 않았다.
854 조회
0 추천
2025.12.17 등록
• Google의 Gemini [GOOG -0.51%] AI 어시스턴트는 이번 주에 새로운 자동 화면 컨텍스트 기능의 출시를 시작했으며, 이 기능은 사용자가 관련 질문을 할 때 화면의 콘텐츠를 자동으로 캡처하고 분석하여 “화면에 대해 물어보기” 버튼을 수동으로 탭할 필요를 없애줍니다• 이 기능은 언어 단서를 사용하여 “이 오류는 무엇을 의미하나요?” 또는 “이 글을 요약해 주세요”와 같은 화면 관련 프롬프트를 감지하며, 앱, 이미지 및 동영상 전반에서 작동합니다. 다만 초기 테스트 결과 이러한 쿼리를 약 50%의 정확도로 식별하는 것으로 나타났습니다.• 사용자는 Gemini 설정을 통해 자동 스크린샷 기능을 비활성화할 수 있으며, Android의 FLAG_SECURE 보호 기능은 뱅킹 앱, 스트리밍 서비스 및 비공개 브라우징 모드가 캡처에서 제외되도록 보장합니다.
844 조회
0 추천
2025.12.17 등록
• Google [GOOG -0.51%]은 12월 16일 Opal 워크플로우 빌더를 Gemini 웹 앱에 통합하여, 사용자들이 Super Gems라는 새로운 기능을 통해 코딩 없이 AI 기반 미니 애플리케이션을 만들 수 있도록 했습니다.• 이 통합은 Opal을 Gemini의 Gems Manager에 통합하며, 자연어 설명을 자동 생성된 단계와 인터페이스 요소가 포함된 시각적 워크플로우로 변환하는 Workflow Builder를 제공하고, 이는 공유 가능한 링크를 통해 게시될 수 있습니다.• 현재 출시는 미국 사용자로 제한되어 있으며, 이는 Google이 Gemini를 맞춤형 AI 도구 구축을 위한 중앙 플랫폼으로 포지셔닝하면서 다른 Labs 통합과 동일한 단계적 접근 방식을 따르고 있습니다.
884 조회
0 추천
2025.12.17 등록
• Jeff Li는 Super Data Science 팟캐스트에서 Netflix, Spotify, DoorDash에서 데이터 과학자로 근무한 경험을 바탕으로, 워크플로우에 대한 사전 인간 숙달 없이는 AI 자동화가 실패한다고 주장합니다 (https://www.youtube.com/watch?v=T7zG5-9-zIw).• Li가 AI 이미지 생성을 사용하여 광고 제작을 자동화하려던 시도는 크리에이티브 디자인에 대한 전문 지식이 부족하여 실패했으며, 그의 기술적 역량과 광고 업계 배경에도 불구하고 고객들은 제작된 광고를 “형편없다”고 평가했습니다[big-agile +1].• 여러 산업 분야의 연구는 AI 시스템이 새로운 실패와 예외 상황을 처리하기 위해 인간의 판단과 도메인 전문 지식을 필요로 한다는 것을 확인하며, 운영자가 효과적으로 개입할 수 있는 조직적 지식이 부족할 때 자동화가 불충분하다는 것을 입증합니다[big-agile +1].
835 조회
0 추천
2025.12.17 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입