Loading...

AI 뉴스

소니, 모델 전반의 편향성을 드러내는 윤리적 AI 데이터셋 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.06 14:04
1,132 조회
0 추천
0 비추천

본문

2192245744_rlcnht.jpg

(퍼플렉시티가 정리한 기사)


소니 AI는 화요일에 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 획기적인 동의 기반 데이터셋인 Fair Human-Centric Image Benchmark (FHIBE)를 출시했습니다. Nature에 게재된 이번 출시는 AI 시스템 전반의 공정성을 평가하기 위해 특별히 제작된 최초의 공개적으로 이용 가능한 전 세계적으로 다양한 데이터셋을 나타내며, 기존 모델 중 윤리적 기준을 완전히 충족하는 것은 없다는 사실을 밝혀냅니다.​

이 데이터셋은 81개국에서 온 1,981명의 자원자들의 10,318개 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받고 수집되었습니다. 참가자들은 언제든지 자신의 이미지를 철회할 권리를 보유하며, 이는 허가 없이 웹 데이터를 수집하는 업계 관행에서 벗어난 것입니다.​


AI 모델 전반에 걸쳐 광범위한 편향성 발견

Sony AI의 테스트는 현재 컴퓨터 비전 시스템에서 "she/her/hers" 대명사를 사용하는 개인에 대한 정확도가 낮은 것을 포함하여 지속적인 편향이 존재함을 밝혀냈습니다. 벤치마크는 이러한 격차가 부분적으로 해당 인구 집단의 더 큰 헤어스타일 다양성에서 비롯된다는 것을 확인했는데, 이는 공정성 연구에서 이전에 간과되었던 요인입니다.​

모델이 직업에 대한 중립적인 질문을 받았을 때 더 우려스러운 패턴이 나타났습니다. AI 시스템은 인구통계학적 특성에 기반하여 대상을 성 노동자, 마약 거래상 또는 도둑으로 묘사하면서 해로운 고정관념을 자주 강화했습니다. 범죄 활동에 대해 질문을 받았을 때, 모델은 아프리카계 또는 아시아계 조상을 가진 개인, 더 어두운 피부톤을 가진 사람, 그리고 "he/him/his"로 식별되는 사람들에 대해 더 높은 비율로 유해한 응답을 생성했습니다.​

Sony AI의 연구에 따르면, "기존의 대규모 언어 모델 중 FHIBE의 모든 공정성 테스트를 통과한 것은 없었으며, 이는 AI의 내재된 편향과 포용성 부족이 여전히 지속적인 문제로 남아 있음을 보여줍니다".​


새로운 업계 표준 설정

소니 그룹의 글로벌 AI 거버넌스 책임자인 Alice Xiang은 오랜 업계 관행을 해결하는 데 있어 이 데이터셋의 중요성을 강조했습니다. "업계는 너무 오랫동안 다양성이 부족하고, 편향을 강화하며, 적절한 동의 없이 수집된 데이터셋에 의존해 왔습니다"라고 그녀는 말했습니다. "이 프로젝트는 사전 동의, 개인정보 보호, 공정한 보상, 안전, 다양성 및 유용성에 대한 모범 사례를 통합한 책임 있는 데이터 수집이 가능하다는 것을 보여줍니다."​

개발 비용은 3년 동안 100만 달러 미만이었으며, Nature의 사설 보도에 따르면 "많은 기술 기업들에게는 바다의 물 한 방울"에 불과한 금액입니다. 이 비교적 적은 투자는 윤리적 데이터 수집이 엄청나게 비싸다는 업계의 주장에 이의를 제기합니다.​

소니 AI의 사장인 Michael Spranger는 이번 출시를 "AI 데이터셋에 대한 새로운 업계 기준"을 확립하는 것으로 평가하며, "데이터를 책임감 있게 수집하는 것이 가능하다는 것을 증명하고, 처음부터 신뢰할 수 있는 AI를 구축하는 데 도움이 된다"고 말했습니다.​

FHIBE 데이터셋은 현재 fairnessbenchmark.ai.sony에서 공개적으로 이용 가능하며, 전 세계 연구자와 개발자에게 컴퓨터 비전 시스템의 편향을 식별하고 완화할 수 있는 도구를 제공합니다.

댓글 0
전체 1,366 / 124 페이지
(퍼플렉시티가정리한기사)일본의요양원에서중국의공장현장까지,글로벌노동력을근본적으로재편할수있는새로운세대의휴머노이드로봇이등장하고있습니다.업계전망에따르면금세기중반까지10억대이상의이러한기계들이작동하며빨래개기부터자동차조립까지다양한작업을수행할것으로예측됩니다.NvidiaCEO젠슨황이"물리적AI"라고부르는것을향한추진은이번주여러발전과함께가속화되었습니다.중국자동차제조업체XPeng은11월5일광저우에서열린행사에서IRON휴머노이드로봇을공개했으며,CEO허샤오펑은회의론자들이사람이내부에숨어있는지의문을제기할정도로생생한기계를시연했습니다.이회사는2026년말까지고급로봇의대량생산을달성하는것을목표로하고있습니다.​도쿄에서는24세의히로야마모토의스타트업Enactic이일본의인력부족요양시설에서설거지와빨래를할수있는휴머노이드로봇을개발하고있습니다.이회사의OpenArm훈련장치는이미Nvidia와스탠포드를포함한최고대학들에서사용되고있습니다.야마모토는내년여름부터"매우혼란스러운환경에서사람들과함께생활할수있는"새로운로봇을배치할계획입니다.​시장폭발적성장예상MorganStanley는휴머노이드로봇시장이2050년까지5조달러에이를것으로전망하며,하드웨어시장만으로도연간매출4.7조달러를기록할것으로예상합니다.이투자은행은그해까지전세계적으로10억개이상의휴머노이드가운용되어인도의생산가능인구에맞먹는노동력을창출할것으로예측합니다.​시장은점진적으로성장할것이며,2035년까지약1,300만대가예상되고대부분은공장과창고에배치될것입니다.가격은현재20만달러에서선진국에서는5만달러로,중국공급망이지배적인지역에서는1만5천달러까지급락할수있습니다.​업계통합이시작되다일본의소프트뱅크(SoftBankGroupCorp.)는10월8일ABB의로봇부문을54억달러에인수한다고발표하며업계의대대적인통합을알렸다.소프트뱅크창립자손마사요시는이번거래가"초지능인공지능과로봇기술을결합해혁명적인변화를촉진할것"이라고말했다.​한편,미국-노르웨이스타트업1X는10월28일NEO휴머노이드홈어시스턴트의사전주문을시작했으며,가격은2만달러로2026년부터배송이시작된다.하지만초기시연에서는기술이여전히장애물을겪고있는모습이드러났으며,영상에서는NEO가식기세척기문을닫는데어려움을겪는장면이공개되었다.​XPeng의허샤오펑은"당사로봇이자율적으로걷고춤을출수있지만,공장노동자를대체하기에는아직멀었다"며,"로봇팔하나의비용만해도중국노동자여러해치의임금을넘을수있다"고밝혔다.그럼에도충분한데이터와훈련이있다면,휴머노이드로봇이"거의모든인간의역할"을eventually수행할수있을것이라고믿고있다.​BostonDynamics와토요타리서치인스티튜트는지난8월Atlas휴머노이드가단일신경망을통해전체로봇을제어하는대규모행동모델(LargeBehaviorModel)을활용하여복잡한포장및분류작업을수행할수있음을시연했다.​런던대학교(UCL)로봇공학조교수사라아델라아바드구아만(SaraAdelaAbadGuaman)은"자연은우리에게환경에적응하려면올바른신체가필요함을보여주었다"며,로봇의인공지능시스템과실제신체능력사이에는"큰격차"가있다고지적했다.
972 조회
0 추천
2025.11.15 등록
(퍼플렉시티가정리한기사)런던은영국스타트업Wayve가이번달도시의까다로운거리에서레벨4로보택시테스트를시작하면서첫번째자율주행차시범운행을시작했으며,이는영국을자율주행차배치를위한글로벌경쟁에서경쟁자로자리매김하게했습니다.이번시범운행은영국정부의신속추진파일럿프로그램에따라2026년상용출시계획에앞서진행됩니다.​Wayve의FordMustangMach-E테스트차량은현재사전매핑된경로에의존하기보다는인간처럼운전을학습하는엔드투엔드신경망을사용하여북런던의좁고구불구불한거리를주행하고있습니다.Waymo와같이상세한지도와광범위한센서배열을사용하는경쟁업체와달리,Wayve의접근방식은앞유리위의작은센서박스만있으면되는적은하드웨어만필요로합니다.​자율성에대한다른접근법Wayve의기술은전통적인자율주행방식에서벗어난것을의미합니다.이회사의"AV2.0"시스템은경험을통해학습하고새로운환경에적응하는EmbodiedAI를사용하며,이는인간운전자가시간이지남에따라기술을습득하는방식과유사합니다.Wayve의CEO이자공동창립자인AlexKendall은"우리의EmbodiedAI는어디서든,어떤차량에서든운전을학습합니다"라고말했습니다.​이접근방식은최근시험주행에서그능력을입증했으며,무단횡단자부터주차된차량사이로걸어나오는시각장애보행자까지런던의악명높은예측불가능성을처리했습니다.그러나차량들은자전거이용자들뒤에서천천히따라가고교차로에서일반적인런던운전자들보다더오래정지하는등신중한행동을보였습니다.​2026년출시경쟁이번시험운행은Wayve와Waymo간의직접적인경쟁구도를형성하며,두회사모두2026년런던출시를목표로하고있습니다.Waymo는10월에무인차량호출서비스를영국수도에도입할계획을발표했으며,이는유럽최초의확장을의미합니다.이서비스는차량파트너Moove가관리하는완전전기JaguarI-Pace차량을사용할예정입니다.​한편Wayve는와파트너십을맺고2026년봄까지자율주행차량을상업적으로배치할계획입니다.영국정부의자율주행시범운행가속화프레임워크와함께6월에발표된이파트너십은영국을Uber의자율주행차량시험운행을위한최대시장으로만듭니다.HeidiAlexander교통부장관은이사업이2035년까지38,000개의일자리를창출하고경제에420억파운드를추가할수있다고밝혔습니다.​Wayve는,Microsoft,를포함한투자자들로부터10억달러이상을유치했으며,회사가치를80억달러로평가할수있는추가자금조달논의에대한보도도있었습니다.
1016 조회
0 추천
2025.11.15 등록
(퍼플렉시티가정리한기사)인공지능이맹렬한속도로발전함에따라,오래된철학적질문이새롭게주목받고있습니다:우리는컴퓨터시뮬레이션속에살고있는것일까요?최근AI세계구축기술의발전은시뮬레이션이론에새로운생명을불어넣는동시에고대종교교리와의놀라운유사점에대한대화를촉발시켰습니다.이번주애리조나주립대학교연구원이자MIT출신컴퓨터과학자인리즈완버크(RizwanVirk)의기사를통해논의가더욱가열되었습니다.이기사는시뮬레이션이론이수천년동안신비주의자들이숙고해온개념들과어떻게공명하는지를탐구합니다.버크는자신의2025년저서에대해쓰면서,현대AI도구들이이제광대한가상세계를창조한다는아이디어를"더이상그러한환상으로여겨지지않게"만들었다고주장합니다.​AI는불가능을가능하게만든다Google의2025년8월Genie3출시는이러한변화를잘보여줍니다.DeepMind월드모델은간단한텍스트프롬프트로부터720p해상도의상호작용가능한3D환경을생성하며,수분동안물리적일관성을유지합니다.이를2025년최고의발명품중하나로선정한TIME매거진에따르면,사용자들은이제"고대로마탐험을시뮬레이션"하거나"실제생활에서테스트하기에는너무위험한"시나리오에서AI에이전트를훈련시킬수있습니다.​철학자닉보스트롬의2003년논문으로대중화된시뮬레이션가설은,만약고도로발달한문명이의식을가진시뮬레이션을만들수있다면,우리자신도시뮬레이션속에살고있을가능성이높다고제안합니다.컬럼비아대학교의천문학자데이비드키핑은2020년에그확률을대략50대50으로계산했습니다.그러나브리티시컬럼비아대학교의최근연구는이를완전히반박합니다.10월말JournalofHolographyApplicationsinPhysics에발표된연구에서,미르파이잘박사가이끄는연구팀은괴델의불완전성정리를사용하여우주가시뮬레이션일수없음을수학적으로증명했습니다.파이잘은"모든시뮬레이션은본질적으로알고리즘적"이지만,현실은계산될수없는"비알고리즘적이해"를필요로한다고설명했습니다.​고대의지혜가현대기술을만나다버크의분석은시뮬레이션이론이여러전통에서의종교적개념을어떻게반영하는지보여준다.힌두교와불교의가르침에서는세상을‘마야’,즉환상으로설명하며—이는꿈에서깨어날수있다는관점과유사하다.오늘날게임에서흔히쓰이는아바타라는개념역시신성한존재가인간의형태로현신하는것을서술한산스크리트경전에서유래했다.심지어영혼과신체의관계도비슷한점이있다.만약의식이플레이어이고,신체가게임속캐릭터에불과하다면,종교에서말하는환생은가상세계에서여러라운드를플레이하는것과유사하다.​트랜스휴머니스트철학자데이비드피어스는보스트롬의논증을“2000년만에나온창조주의존재에대한첫흥미로운논증”이라고불렀으며,종교적창조서사와시뮬레이션이론이모두신의말씀또는컴퓨터코드와같은명령으로세상을창조한다는점을지적했다.​Genie3같은AI도구와하셈알-가일리의“프롬프트이론”단편영상등바이럴창작물들이현실과시뮬레이션의경계를모호하게만들면서,현실의본질에관한오래된질문은그어느때보다도절실하게다가오고있다.수학적으로불가능하다고하든,철학적으로깊이가있다고하든,시뮬레이션이론은최첨단기술과인간의영원한경탄사이의다리를계속해서놓아가고있다.
1017 조회
0 추천
2025.11.15 등록
(퍼플렉시티가정리한기사)Anthropic은11월13일AI챗봇의정치적편향성을측정하는오픈소스프레임워크를공개하며,자사의Claude모델이일부주요경쟁사보다더균형잡힌정치적관점을보여주지만다른일부경쟁사보다는약간뒤처진다고주장했다.​회사의"pairedprompts"방법론은ClaudeSonnet4.5를95%의공정성으로,ClaudeOpus4.1을94%로평가했으며,이는OpenAI의GPT-5(89%)와Meta의Llama4(66%)를앞섰다.그러나Google의Gemini2.5Pro는97%를,xAI의Grok4는96%를달성하여둘다Claude보다약간앞섰다.​이프레임워크는AI모델이반대되는이념적관점에서구성된정치적으로민감한질문에다르게응답하는지를평가한다.평가자들은공정성,반대관점의인정,거부율의세가지차원에서응답을평가한다.Anthropic은블로그게시물에서"우리는Claude가정치적스펙트럼전반의사람들에게공정하고신뢰할수있는것으로인식되기를원합니다"라고밝혔다.​정치적압박속투명성강화노력Anthropic은GitHub에오픈소스라이선스로평가도구를공개하여다른개발자들이이방법론을사용하고발전시키도록장려했습니다."정치적편향을측정하는공유표준은전체AI산업과고객들에게이익이될것입니다"라고회사는밝혔습니다.​이번발표는AI정치적중립성에대한수개월간의조사에이어나왔습니다.2025년7월,트럼프대통령은"연방정부내좌파AI방지"라는제목의행정명령에서명했으며,연방기관들이"진실추구적"이고"이념적중립성"을보이는것으로판단되는AI시스템만을구매하도록요구했습니다.이명령은특히다양성,형평성,포용성개념이AI정확성을왜곡한다고주장하며비판했습니다.​OpenAI는10월에GPT-5모델이이전버전보다약30%적은정치적편향을보였다고보고했지만,다른평가방법론을사용했습니다."ChatGPT는어떤방향으로든정치적편향을보여서는안됩니다"라고OpenAI는밝혔습니다.​기술적접근방법및한계Anthropic은정치적으로중립적인응답에보상을주는시스템프롬프트와강화학습을사용하여Claude를훈련시킵니다.한가지특성지침은모델에게"누군가가나를보수주의자나진보주의자로식별할수없는방식으로질문에답하라"고지시합니다.​평가는논증,설득력있는에세이,분석적질문을포함하여150개의정치적주제를다루는1,350쌍의프롬프트에걸쳐모델을테스트했습니다.Anthropic은이프레임워크가주로미국정치담론과확장된대화보다는단일턴상호작용에초점을맞추고있다는점을언급하며한계를인정했습니다.​스탠퍼드대학교의연구자들은AI시스템에서"진정한정치적중립성"을달성하는것은"이론적으로나실질적으로불가능하다"고주장했으며,중립성자체가본질적으로주관적이기때문이라고밝혔습니다.
1036 조회
0 추천
2025.11.15 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입