AI 뉴스

소니, 모델 전반의 편향성을 드러내는 윤리적 AI 데이터셋 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.06 14:04
1,067 조회
0 추천
0 비추천

본문

2192245744_rlcnht.jpg

(퍼플렉시티가 정리한 기사)


소니 AI는 화요일에 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 획기적인 동의 기반 데이터셋인 Fair Human-Centric Image Benchmark (FHIBE)를 출시했습니다. Nature에 게재된 이번 출시는 AI 시스템 전반의 공정성을 평가하기 위해 특별히 제작된 최초의 공개적으로 이용 가능한 전 세계적으로 다양한 데이터셋을 나타내며, 기존 모델 중 윤리적 기준을 완전히 충족하는 것은 없다는 사실을 밝혀냅니다.​

이 데이터셋은 81개국에서 온 1,981명의 자원자들의 10,318개 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받고 수집되었습니다. 참가자들은 언제든지 자신의 이미지를 철회할 권리를 보유하며, 이는 허가 없이 웹 데이터를 수집하는 업계 관행에서 벗어난 것입니다.​


AI 모델 전반에 걸쳐 광범위한 편향성 발견

Sony AI의 테스트는 현재 컴퓨터 비전 시스템에서 "she/her/hers" 대명사를 사용하는 개인에 대한 정확도가 낮은 것을 포함하여 지속적인 편향이 존재함을 밝혀냈습니다. 벤치마크는 이러한 격차가 부분적으로 해당 인구 집단의 더 큰 헤어스타일 다양성에서 비롯된다는 것을 확인했는데, 이는 공정성 연구에서 이전에 간과되었던 요인입니다.​

모델이 직업에 대한 중립적인 질문을 받았을 때 더 우려스러운 패턴이 나타났습니다. AI 시스템은 인구통계학적 특성에 기반하여 대상을 성 노동자, 마약 거래상 또는 도둑으로 묘사하면서 해로운 고정관념을 자주 강화했습니다. 범죄 활동에 대해 질문을 받았을 때, 모델은 아프리카계 또는 아시아계 조상을 가진 개인, 더 어두운 피부톤을 가진 사람, 그리고 "he/him/his"로 식별되는 사람들에 대해 더 높은 비율로 유해한 응답을 생성했습니다.​

Sony AI의 연구에 따르면, "기존의 대규모 언어 모델 중 FHIBE의 모든 공정성 테스트를 통과한 것은 없었으며, 이는 AI의 내재된 편향과 포용성 부족이 여전히 지속적인 문제로 남아 있음을 보여줍니다".​


새로운 업계 표준 설정

소니 그룹의 글로벌 AI 거버넌스 책임자인 Alice Xiang은 오랜 업계 관행을 해결하는 데 있어 이 데이터셋의 중요성을 강조했습니다. "업계는 너무 오랫동안 다양성이 부족하고, 편향을 강화하며, 적절한 동의 없이 수집된 데이터셋에 의존해 왔습니다"라고 그녀는 말했습니다. "이 프로젝트는 사전 동의, 개인정보 보호, 공정한 보상, 안전, 다양성 및 유용성에 대한 모범 사례를 통합한 책임 있는 데이터 수집이 가능하다는 것을 보여줍니다."​

개발 비용은 3년 동안 100만 달러 미만이었으며, Nature의 사설 보도에 따르면 "많은 기술 기업들에게는 바다의 물 한 방울"에 불과한 금액입니다. 이 비교적 적은 투자는 윤리적 데이터 수집이 엄청나게 비싸다는 업계의 주장에 이의를 제기합니다.​

소니 AI의 사장인 Michael Spranger는 이번 출시를 "AI 데이터셋에 대한 새로운 업계 기준"을 확립하는 것으로 평가하며, "데이터를 책임감 있게 수집하는 것이 가능하다는 것을 증명하고, 처음부터 신뢰할 수 있는 AI를 구축하는 데 도움이 된다"고 말했습니다.​

FHIBE 데이터셋은 현재 fairnessbenchmark.ai.sony에서 공개적으로 이용 가능하며, 전 세계 연구자와 개발자에게 컴퓨터 비전 시스템의 편향을 식별하고 완화할 수 있는 도구를 제공합니다.

댓글 0
전체 1,366 / 138 페이지
(퍼플렉시티가정리한기사)전DeepSeek연구원LuoFuli는11월12일의MiMoAI팀에합류했다고발표했으며,이는중국기술대기업의수개월간의채용노력의결실을의미하고중국의급속도로발전하는인공지능산업에서AI인재에대한치열한경쟁을강조한다.​"지능은언어를넘어물리적세계로나아갈것입니다"라고Luo는자신의WeChat계정에썼다."저는샤오미MiMo에서창의적이고재능있으며진실한연구원들과함께그러한미래를만들어갈것입니다."​PanDaily에따르면,DeepSeek의V2모델에기여한것으로알려진29세연구원은MiMo팀의책임자로임명되었다.그녀의합류는스마트폰,전기차,스마트홈기기를통합하는"HumanxCarxHome"생태계를개발하는샤오미의AI역량을강화할것으로예상된다.​AI인재확보를위한치열한경쟁샤오미창립자레이쥔은루오영입을위해직접나섰으며,중국언론은연간보수패키지가1천만위안,약140만달러라고보도했습니다.이번영입은기술대기업들이전문인재를확보하기위해치열하게경쟁하고있는중국AI산업의광범위한트렌드를반영합니다.​맥킨지의데이터에따르면,AI제품구축에능숙한인재에대한중국의수요는2030년까지100만명에서600만명으로6배증가할것으로예상되는반면,대학및기존인재풀은약200만명만공급할것으로추정되어AI역할에대한400만명의인력부족이발생할것으로전망됩니다.​루오는샤오미에상당한자격을가져왔습니다.그녀는베이징대학교전산언어학연구소에서석사학위를취득했으며2019년권위있는ACL컨퍼런스에서8편의논문을발표했습니다.졸업후그녀는의DAMOAcademy에합류하여다국어사전학습모델VECO개발을주도했습니다.2022년그녀는DeepSeek에합류하여2024년5월에출시된DeepSeek-V2모델의핵심기여자가되었습니다.​DeepSeek-V2는Multi-headLatentAttention을도입하여품질을유지하면서최첨단AI모델학습에필요한컴퓨팅요구사항을절반으로줄이는혁신을이루었습니다.이획기적인성과는업계리더들의주목을받았으며,Anthropic창립자잭클락은DeepSeek이이러한발전을이룰수있는"불가사의한마법사들"을고용했다고언급했습니다.​샤오미의AI야망샤오미는2025년4월첫대규모언어모델인MiMo를출시했습니다.70억개의매개변수를가진이모델은추론작업에중점을두고있으며,Core로알려진회사의AI태스크포스가강화학습을사용하여개발했습니다.벤치마크테스트에서샤오미는이모델이수학및코드생성분야에서OpenAI의o1-mini와알리바바의Qwen-32B-Preview의성능과대등하거나이를초과한다고주장했습니다.​Luo는이미10월에샤오미와베이징대학교가공동으로발표한최근AI논문에"독립연구원"으로공동저자로등장했으며,업계관계자들은이를경업금지의무와관련된전환기간으로해석했습니다.11월12일그녀의공식발표는샤오미팀에완전히합류했음을확인했습니다.
1045 조회
0 추천
2025.11.12 등록
(퍼플렉시티가정리한기사)전구글CEO에릭슈미트는중국의오픈소스인공지능모델이우수한품질때문이아니라무료이기때문에글로벌표준이될수있다는강력한경고를발표했습니다.화요일에공개된Moonshots팟캐스트에서슈미트는대부분의국가들이비용제약으로인해DeepSeek와알리바바의Qwen같은중국AI시스템을채택할것을가장우려한다고말했습니다."이것은미국의가장큰모델들은폐쇄형소스이고중국의가장큰모델들은오픈소스인기묘한결과를만들어냅니다"라고슈미트는말했습니다."서방이가진종류의자금을갖지못한대다수의정부와국가들은중국모델이더나아서가아니라무료이기때문에결국중국모델을표준으로채택하게될것입니다."​이러한우려는이론적인것이상입니다.블룸버그에따르면,개발자플랫폼HuggingFace에서중국모델의다운로드수가이미미국대안을초과했습니다.알리바바의Qwen모델은메타의Llama의3억4,620만건에비해약3억8,530만건의다운로드를기록했습니다.중국출처의파생모델은이제HuggingFace의새로운언어모델출시의40%이상을차지하는반면,메타의점유율은약15%로떨어졌습니다.​실리콘밸리가중국모델을채택하다이러한변화는이미미국기업들에영향을미치고있습니다.에어비앤비CEO브라이언체스키는10월에자신의회사가AI기반고객서비스를위해알리바바의Qwen모델에"크게의존"하고있으며,이를"매우좋고,빠르고,저렴하다"고평가했습니다.벤처캐피털리스트차마스팔리하피티야는자신의팟캐스트에서함께일하는한회사가비용이점을이유로중국스타트업MoonshotAI의KimiK2모델로주요작업량을이전했다고말했습니다.​주권AI논쟁심화"주권AI"—국가가자국의AI기술,데이터및인프라를통제하는것—에대한논쟁이점점더시급해지고있다.NvidiaCEO젠슨황은올해초두바이에서열린세계정부정상회의에서각국정부관계자들에게문화적·기술적독립성을보존하기위해각국이자체대규모언어모델을구축해야한다고말했다.11월에황은"중국이AI경쟁에서승리할것"이라고경고한후,중국이미국보다"나노초뒤처져있다"고설명했다​2001년부터2015년까지Google을이끌었고현재항공스타트업RelativitySpace를운영하고있는슈미트는오픈소스대클로�드소스의구분이잠재적인지정학적단층선이될수있다고말했다.이러한추세는데이터프라이버시,국가안보,그리고AI분야에서미국의경쟁우위에대한우려를불러일으킨다.
1159 조회
0 추천
2025.11.12 등록
(퍼플렉시티가정리한기사)AntInternational은전세계기업을위한시계열예측을혁신하도록설계된오픈소스인공지능모델인FalconTST를공개했습니다.2025년싱가포르핀테크페스티벌에서발표된이모델은현재GitHub와HuggingFace에서전세계개발자및연구기관이이용할수있습니다.​싱가포르에본사를둔이핀테크회사는FalconTST를여러패치토크나이저를갖춘업계최초의MixtureofExperts아키텍처기반시계열예측모델로설명하며,최대25억개의매개변수를지원합니다.AntInternationalCEOYangPeng에따르면,이모델은현재회사글로벌거래의약60%를처리하고있으며,2025년첫10개월동안거래액은1.5조달러에달해2024년대비36%증가했습니다.​통화관리에서입증된결과FalconTST는2024년부터AntInternational에내부적으로배포되어시간별,일별,주별현금흐름및외환익스포저예측에서90%를초과하는정확도를달성했습니다.이모델은여러출처에따르면회사의외환비용을최대60%까지절감하는데기여했습니다.​AntInternational의최고혁신책임자인Jiang-MingYang은"검증된FalconTST모델을오픈소스화함으로써전세계과학자들이실제피드백을제공하고시계열학습의혁신을가속화하도록초대하여글로벌협업을통해이분야를발전시키는것을목표로합니다"라고말했습니다.​이모델은이미여러부문의산업파트너들과함께배포되었습니다.2025년7월,Citi와AntInternational은아시아의한항공사와함께FalconTST모델을시범운영하여초기실제거래에서외환헤지비용을30%절감했습니다.별도로CapitalA는AirAsia를위해이모델을활용하여90%의예측정확도를달성하면서외환헤지비용을최대40%까지절감했습니다.​산업전반에걸친광범위한응용재무예측을넘어,FalconTST는기업들이날씨패턴,달력이벤트,금융시장변동,국경간교통량을포함한다양한시계열데이터를예측할수있도록지원합니다.국제공항협의회(AirportsCouncilInternationalWorld)가2025년전세계항공여행객이98억명에달할것으로전망하는가운데,항공사자금관리분야에서이모델의활용은전세계소비자들의비용절감으로이어질수있습니다.​이회사는또한Shield라는두번째AI기초모델을개발했습니다.이는80억개의매개변수를가진결제위험통제모델로,매일2,200만건의거래를보호하며사기를13.5%감소시킵니다.
1035 조회
0 추천
2025.11.12 등록
(퍼플렉시티가정리한기사)바이두는11월11일ERNIE-4.5-VL-28B-A3B-Thinking을공개했다.이는오픈소스멀티모달AI모델로,중국기술대기업은이모델이여러벤치마크에서OpenAI의GPT-5와구글의Gemini2.5Pro를능가한다고주장한다.이번출시는중국과서구기술기업간격화되는인공지능경쟁에서중요한확대를의미한다.​허용적인Apache2.0라이선스로공개된이모델은총280억개의파라미터를가진전문가혼합(Mixture-of-Experts)아키텍처를사용하지만,추론당30억개만활성화하여높은성능을유지하면서도계산비용을획기적으로줄인다.바이두의발표에따르면,이모델은문서및차트이해분야의VQA,MMBench,SEED-Bench평가에서Gemini2.5Pro를능가한다.​효율성과성능의만남경량설계를통해ERNIE-4.5-VL은비슷한수준의전체매개변수모델보다2~3배빠른추론속도를제공하면서도훨씬적은메모리를요구합니다.이모델은이미지의특정영역을확대하고,잘라낸뷰를분석하며,국소적관찰을종합적인답변으로통합할수있는혁신적인"이미지를통한사고(ThinkingwithImages)"기능을도입했습니다.​바이두연구진은동적난이도샘플링을적용한GSPO및IcePop을포함한고급강화학습전략을활용하여대규모시각-언어추론데이터에대한광범위한중간학습단계를통해이모델을훈련했습니다.이모델은시각적추론,STEM문제해결,시각적그라운딩,도구활용및비디오이해분야에서뛰어난성능을발휘합니다.​전략적오픈소스추진이번출시는중국이미국기업들과경쟁하기위해오픈소스AI전략을강화하는가운데이루어졌습니다.최근분석에따르면,중국은오픈소스AI다운로드에서미국을앞질렀으며,DeepSeek,Alibaba,Baidu같은기업들이서구경쟁사들보다더빠르고저렴하게고성능모델을생산할수있음을입증하고있습니다.​남가주대학교(UniversityofSouthernCalifornia)의SeanRen은CNBC에"주요연구소가강력한모델을오픈소스로공개할때마다업계전체의기준이높아진다"고말했습니다.이러한움직임은독점API와프리미엄가격에의존하는OpenAI와Anthropic같은비공개소스제공업체들에압박을가하고있습니다.​Baidu는11월13일베이징에서열리는BaiduWorld2025컨퍼런스에서ERNIE라인업과추가AI발전사항을선보일예정입니다.이는중국의경쟁적인AI환경에서선두주자로서의입지를굳히기위한노력의일환입니다.
1116 조회
0 추천
2025.11.12 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입