Loading...

AI 뉴스

소니, 모델 전반의 편향성을 드러내는 윤리적 AI 데이터셋 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.06 14:04
1,398 조회
0 추천
0 비추천

본문

2192245744_rlcnht.jpg

(퍼플렉시티가 정리한 기사)


소니 AI는 화요일에 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 획기적인 동의 기반 데이터셋인 Fair Human-Centric Image Benchmark (FHIBE)를 출시했습니다. Nature에 게재된 이번 출시는 AI 시스템 전반의 공정성을 평가하기 위해 특별히 제작된 최초의 공개적으로 이용 가능한 전 세계적으로 다양한 데이터셋을 나타내며, 기존 모델 중 윤리적 기준을 완전히 충족하는 것은 없다는 사실을 밝혀냅니다.​

이 데이터셋은 81개국에서 온 1,981명의 자원자들의 10,318개 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받고 수집되었습니다. 참가자들은 언제든지 자신의 이미지를 철회할 권리를 보유하며, 이는 허가 없이 웹 데이터를 수집하는 업계 관행에서 벗어난 것입니다.​


AI 모델 전반에 걸쳐 광범위한 편향성 발견

Sony AI의 테스트는 현재 컴퓨터 비전 시스템에서 "she/her/hers" 대명사를 사용하는 개인에 대한 정확도가 낮은 것을 포함하여 지속적인 편향이 존재함을 밝혀냈습니다. 벤치마크는 이러한 격차가 부분적으로 해당 인구 집단의 더 큰 헤어스타일 다양성에서 비롯된다는 것을 확인했는데, 이는 공정성 연구에서 이전에 간과되었던 요인입니다.​

모델이 직업에 대한 중립적인 질문을 받았을 때 더 우려스러운 패턴이 나타났습니다. AI 시스템은 인구통계학적 특성에 기반하여 대상을 성 노동자, 마약 거래상 또는 도둑으로 묘사하면서 해로운 고정관념을 자주 강화했습니다. 범죄 활동에 대해 질문을 받았을 때, 모델은 아프리카계 또는 아시아계 조상을 가진 개인, 더 어두운 피부톤을 가진 사람, 그리고 "he/him/his"로 식별되는 사람들에 대해 더 높은 비율로 유해한 응답을 생성했습니다.​

Sony AI의 연구에 따르면, "기존의 대규모 언어 모델 중 FHIBE의 모든 공정성 테스트를 통과한 것은 없었으며, 이는 AI의 내재된 편향과 포용성 부족이 여전히 지속적인 문제로 남아 있음을 보여줍니다".​


새로운 업계 표준 설정

소니 그룹의 글로벌 AI 거버넌스 책임자인 Alice Xiang은 오랜 업계 관행을 해결하는 데 있어 이 데이터셋의 중요성을 강조했습니다. "업계는 너무 오랫동안 다양성이 부족하고, 편향을 강화하며, 적절한 동의 없이 수집된 데이터셋에 의존해 왔습니다"라고 그녀는 말했습니다. "이 프로젝트는 사전 동의, 개인정보 보호, 공정한 보상, 안전, 다양성 및 유용성에 대한 모범 사례를 통합한 책임 있는 데이터 수집이 가능하다는 것을 보여줍니다."​

개발 비용은 3년 동안 100만 달러 미만이었으며, Nature의 사설 보도에 따르면 "많은 기술 기업들에게는 바다의 물 한 방울"에 불과한 금액입니다. 이 비교적 적은 투자는 윤리적 데이터 수집이 엄청나게 비싸다는 업계의 주장에 이의를 제기합니다.​

소니 AI의 사장인 Michael Spranger는 이번 출시를 "AI 데이터셋에 대한 새로운 업계 기준"을 확립하는 것으로 평가하며, "데이터를 책임감 있게 수집하는 것이 가능하다는 것을 증명하고, 처음부터 신뢰할 수 있는 AI를 구축하는 데 도움이 된다"고 말했습니다.​

FHIBE 데이터셋은 현재 fairnessbenchmark.ai.sony에서 공개적으로 이용 가능하며, 전 세계 연구자와 개발자에게 컴퓨터 비전 시스템의 편향을 식별하고 완화할 수 있는 도구를 제공합니다.

댓글 0
전체 1,366 / 68 페이지
샌프란시스코에기반을둔AI연구기업자이프라(Zyphra)는일요일,자사가최초로대규모Mixture-of-Experts(전문가혼합)기반파운데이션모델인ZAYA1을완전히AMD하드웨어에서학습시키는데성공했다고발표했습니다.이는AI모델학습분야에서NVIDIA의지배에도전하는중요한이정표로평가받고있습니다.이모델은AMDInstinctMI300XGPU및AMDPensando네트워킹,IBM클라우드인프라에서학습을진행했으며,NVIDIA의플랫폼외에도최첨단AI개발을충분히감당할수있다는점을입증했습니다.총83억개의파라미터에활성파라미터는7억6천만개만사용했음에도불구하고,ZAYA1은Meta의Llama-3-8B,Alibaba의Qwen3-4B,Google의Gemma3-12B등더큰모델들과견주거나더나은성능을추론,수학,코딩벤치마크에서보였습니다.​기술적돌파구가AMD의AI역량을입증하다이성과는AMD플랫폼의여러기술적장점을보여줍니다.MI300XGPU의192GB고대역폭메모리는비용이많이드는전문가샤딩이나텐서샤딩없이효율적인대규모학습을가능하게하여개발프로세스를간소화했습니다.Zyphra는AMD최적화분산I/O를사용하여10배이상빠른모델저장시간을달성했으며,이를통해학습신뢰성과효율성을향상시켰다고보고했습니다.​Zyphra의CEO인KrithikPuthalath는"ZAYA1은이러한철학을반영하며,AMD플랫폼에서대규모학습을시연한최초의회사가되어기쁘게생각합니다"라고말했습니다.이번협력은10월에발표된IBM과AMD간의다년간계약을기반으로하며,Zyphra에고급AI인프라를제공하기위한것입니다.​AI하드웨어시장에대한경쟁적시사점성공적인훈련은현재NVIDIA가지배하고있는AI인프라시장에서더많은점유율을확보하려는AMD의중요한과제를해결합니다.AMD는AI훈련GPU시장에서NVIDIA에비해약94%의시장점유율열세를보이고있지만,향후3~5년동안데이터센터AI사업이연평균60%이상의성장률을기록할것으로전망하고있습니다.​​Mixture-of-Experts아키텍처는OpenAI의GPT-5,Anthropic의Claude-4.5,DeepSeek-V3를포함한현대최첨단AI시스템의기본설계가되었습니다.이러한모델은동적으로활성화되는전문화된전문가네트워크를사용하여기존의밀집아키텍처보다더큰효율성과확장성을제공합니다.​AMD의수석부사장겸최고상업책임자인PhilipGuido는"이이정표는혁신적인AMD하드웨어및소프트웨어솔루션이업계선두기업들과함께차세대최첨단AI개발을가능하게하고있음을강조합니다"라고말했습니다.
796 조회
0 추천
2025.11.25 등록
도널드트럼프미국대통령이24일(현지시간)인공지능개발을가속화하는대규모국가프로젝트'제네시스미션(GenesisMission)'출범을위한행정명령에서명했다.백악관은이번이니셔티브를아폴로프로그램이후연방과학자원의최대동원이라고평가하며,맨해튼프로젝트에필적하는긴급성과야망을가진국가적노력이라고강조했다.​마이클크라치오스백악관과학기술정책실장은기자들에게"제네시스미션은아폴로프로그램이후연방과학자원의최대동원"이라고밝혔다.그는"방대한연방데이터세트,첨단슈퍼컴퓨팅성능,세계적수준의과학시설을결합함으로써제네시스미션은AI를활용해실험설계를자동화하고,시뮬레이션을가속하며,단백질접힘부터핵융합플라스마역학에이르기까지모든분야를위한예측모델을만들어낼것"이라고설명했다.​에너지부주도로통합AI플랫폼구축행정명령은에너지부장관크리스라이트에게17개국립연구소의슈퍼컴퓨터와연방과학데이터세트를활용한통합AI플랫폼구축을지시한다.이플랫폼은과학기초모델을훈련하고,새로운가설을검증하며,연구흐름을자동화하는AI에이전트를창출할예정이다.​백악관은엔비디아,델,AMD,HPE,오라클등주요기업들과의협력을통해슈퍼컴퓨팅역량을강화할계획이다.에너지부는최근아르곤국립연구소에엔비디아블랙웰GPU10만개를탑재한'솔스티스'시스템을포함해여러대의새로운AI슈퍼컴퓨터구축을발표했다.​중국과의AI경쟁대응트럼프대통령은행정명령에서"오늘날미국은과학적발견과경제성장의가장중요한최첨단영역인AI개발분야에서글로벌기술주도권경쟁을벌이고있다"고강조했다.그는"이중대한순간에우리가직면한도전은2차세계대전에서우리가승리하는데중요했던맨해튼프로젝트의긴급성과야망에비교할만한역사적인국가적노력을요구한다"고말했다.​라이트에너지부장관은"AI경쟁에서승리하려면미국기술과과학이제공하는가장뛰어난인재와산업을하나로모으는혁신적인파트너십이필요하다"고밝혔다.제네시스미션은질병치료,에너지,국가안보를포함한다양한분야에서과학적발견을극적으로가속화하는것을목표로한다.크라치오스실장은이를통해"발견타임라인을수년에서수일또는수시간으로단축"할수있을것이라고전망했다.
802 조회
0 추천
2025.11.25 등록
Alphabet가MetaPlatforms와Meta의데이터센터에맞춤형AI칩을공급하는수십억달러규모의계약을논의중이라고TheInformation이월요일저녁보도했습니다.이는구글이AI인프라시장에서엔비디아의지배력에도전하는전략적변화를의미합니다.​제안된협약에따르면Meta는2027년부터자사시설에구글의텐서프로세싱유닛(TPU)을도입할예정이며,이르면내년부터구글클라우드에서TPU용량을임대받을계획입니다.이번거래는구글이기존에GoogleCloudPlatform을통한클라우드임대에만독점적으로TPU를제공해온오랜방침에서크게벗어난것이라할수있습니다이소식이발표된후,알파벳의주가는월요일장마감후시간외거래에서2.1%에서2.5%상승한반면,엔비디아의주가는1.8%하락했습니다.주가변동은알파벳이최근새롭게출시한Gemini3AI모델의긍정적인반응에힘입어정규장거래에서이미6%이상급등한직후에나타났습니다.​AI칩시장의전략적변화Google은Meta를비롯하여고빈도거래회사와주요금융기관등다양한잠재고객들에게TPU를적극적으로제안하고있으며,온프레미스배포가조직의엄격한보안및규정준수요구사항을충족하는데도움이될수있다고강조하고있습니다.Meta는현재자사애플리케이션전반에걸쳐매일30억명이상의사용자에게서비스를제공하는대규模AI인프라를구동하기위해주로NvidiaGPU에의존하고있습니다.​GoogleCloud경영진은TPU채택확대를통해Nvidia의연간매출의최대10%를확보할수있으며,이는수십억달러의잠재적이익을의미한다고믿고있습니다.이러한추진은AI컴퓨팅에대한글로벌수요가계속급증하고업계전반에걸쳐공급제약이지속되고있는상황에서이루어지고있습니다.​심화되는경쟁잠재적인Meta거래는맞춤형AI칩에대한Google의10년간의투자를입증할것입니다.Google은최근7세대TPU인Ironwood를출시했으며,이는이전세대보다4배의성능을제공하고2018년첫번째CloudTPU보다거의30배더에너지효율적이라고회사는주장합니다.​10월에Anthropic은수백억달러규모의거래에서Google의TPU최대100만개에액세스하기로약속했습니다.이AI스타트업은TPU의"가격대비성능및효율성"을결정의주요요인으로꼽았습니다.Google은TPU설계및제조를위해Broadcom과파트너십을맺고있으며,Broadcom의주가는월요일Google의AI모멘텀에대한긍정적인sentiment을반영하여10%급등했습니다.
764 조회
0 추천
2025.11.25 등록
Anthropic은월요일에ClaudeOpus4.5를출시하며,코딩,자율에이전트,사무생산성분야에서향상된기능을갖춘Claude4.5모델패밀리를완성했다.Amazon과Alphabet의지원을받는이AI스타트업은새로운플래그십모델을Google과OpenAI의최근출시제품에대한직접적인경쟁자로포지셔닝했다.​이모델은실제소프트웨어엔지니어링작업을위한벤치마크인SWE-benchVerified에서80.9%를달성하여,Google의Gemini3Pro(76.2%)와OpenAI의GPT-5.1CodexMax(77.9%)를능가했다.Anthropic의개발자관계책임자인AlexAlbert는BusinessInsider에이모델이"우리가정말로중요하게생각하는분야에서세계에서가장지능적인모델"을대표한다고말했다.​향상된직장역량ClaudeOpus4.5는확장된대화에서맥락을유지하는"무한채팅"과개발자가응답품질과토큰효율성의균형을맞출수있는새로운"노력매개변수"를포함하여기업사용자를대상으로하는여러기능을도입했습니다.Anthropic에따르면,중간노력수준에서이모델은ClaudeSonnet4.5의성능과일치하면서도출력토큰을76%적게사용합니다.​이번릴리스에는MicrosoftExcel및Chrome과의통합이포함되어있어AI가스프레드시트를분석하고브라우저기반작업을자동화할수있습니다.초기고객들은재무모델링에서20%의정확도향상과복잡한작업에서15%의효율성증가를보고했습니다.​시장경쟁이심화된다이번출시는지난주Google의Gemini3출시와이달초OpenAI의GPT-5.1데뷔에이어이루어졌습니다.MenloVentures의2025년중반보고서에따르면,Anthropic은기업AI시장의32%를점유하여OpenAI의25%점유율을추월했습니다.회사의시장점유율은2023년12%에서상승했으며,같은기간OpenAI는50%에서하락했습니다.​Amazon은Anthropic에80억달러를투자했으며,Google은20억달러를투입했습니다.두회사모두최근분기실적에서Anthropic지분으로인한수십억달러의미실현이익을보고했으며,Amazon은95억달러의세전이익을,Alphabet은이투자로인한지분증권에서107억달러의순이익을인식했습니다.​ClaudeOpus4.5는월$17부터시작하는Pro사용자,월$100의Max사용자,그리고Enterprise고객에게제공됩니다.이모델은GitHubCopilot과도통합되어있으며프로모션기간동안코딩에이전트의기본모델로제공될예정입니다.
767 조회
0 추천
2025.11.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입