Loading...

AI 뉴스

소니, 모델 전반의 편향성을 드러내는 윤리적 AI 데이터셋 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.06 14:04
1,066 조회
0 추천
0 비추천

본문

2192245744_rlcnht.jpg

(퍼플렉시티가 정리한 기사)


소니 AI는 화요일에 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 획기적인 동의 기반 데이터셋인 Fair Human-Centric Image Benchmark (FHIBE)를 출시했습니다. Nature에 게재된 이번 출시는 AI 시스템 전반의 공정성을 평가하기 위해 특별히 제작된 최초의 공개적으로 이용 가능한 전 세계적으로 다양한 데이터셋을 나타내며, 기존 모델 중 윤리적 기준을 완전히 충족하는 것은 없다는 사실을 밝혀냅니다.​

이 데이터셋은 81개국에서 온 1,981명의 자원자들의 10,318개 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받고 수집되었습니다. 참가자들은 언제든지 자신의 이미지를 철회할 권리를 보유하며, 이는 허가 없이 웹 데이터를 수집하는 업계 관행에서 벗어난 것입니다.​


AI 모델 전반에 걸쳐 광범위한 편향성 발견

Sony AI의 테스트는 현재 컴퓨터 비전 시스템에서 "she/her/hers" 대명사를 사용하는 개인에 대한 정확도가 낮은 것을 포함하여 지속적인 편향이 존재함을 밝혀냈습니다. 벤치마크는 이러한 격차가 부분적으로 해당 인구 집단의 더 큰 헤어스타일 다양성에서 비롯된다는 것을 확인했는데, 이는 공정성 연구에서 이전에 간과되었던 요인입니다.​

모델이 직업에 대한 중립적인 질문을 받았을 때 더 우려스러운 패턴이 나타났습니다. AI 시스템은 인구통계학적 특성에 기반하여 대상을 성 노동자, 마약 거래상 또는 도둑으로 묘사하면서 해로운 고정관념을 자주 강화했습니다. 범죄 활동에 대해 질문을 받았을 때, 모델은 아프리카계 또는 아시아계 조상을 가진 개인, 더 어두운 피부톤을 가진 사람, 그리고 "he/him/his"로 식별되는 사람들에 대해 더 높은 비율로 유해한 응답을 생성했습니다.​

Sony AI의 연구에 따르면, "기존의 대규모 언어 모델 중 FHIBE의 모든 공정성 테스트를 통과한 것은 없었으며, 이는 AI의 내재된 편향과 포용성 부족이 여전히 지속적인 문제로 남아 있음을 보여줍니다".​


새로운 업계 표준 설정

소니 그룹의 글로벌 AI 거버넌스 책임자인 Alice Xiang은 오랜 업계 관행을 해결하는 데 있어 이 데이터셋의 중요성을 강조했습니다. "업계는 너무 오랫동안 다양성이 부족하고, 편향을 강화하며, 적절한 동의 없이 수집된 데이터셋에 의존해 왔습니다"라고 그녀는 말했습니다. "이 프로젝트는 사전 동의, 개인정보 보호, 공정한 보상, 안전, 다양성 및 유용성에 대한 모범 사례를 통합한 책임 있는 데이터 수집이 가능하다는 것을 보여줍니다."​

개발 비용은 3년 동안 100만 달러 미만이었으며, Nature의 사설 보도에 따르면 "많은 기술 기업들에게는 바다의 물 한 방울"에 불과한 금액입니다. 이 비교적 적은 투자는 윤리적 데이터 수집이 엄청나게 비싸다는 업계의 주장에 이의를 제기합니다.​

소니 AI의 사장인 Michael Spranger는 이번 출시를 "AI 데이터셋에 대한 새로운 업계 기준"을 확립하는 것으로 평가하며, "데이터를 책임감 있게 수집하는 것이 가능하다는 것을 증명하고, 처음부터 신뢰할 수 있는 AI를 구축하는 데 도움이 된다"고 말했습니다.​

FHIBE 데이터셋은 현재 fairnessbenchmark.ai.sony에서 공개적으로 이용 가능하며, 전 세계 연구자와 개발자에게 컴퓨터 비전 시스템의 편향을 식별하고 완화할 수 있는 도구를 제공합니다.

댓글 0
전체 1,366 / 139 페이지
(퍼플렉시티가정리한기사)막스플랑크기상연구소의연구자들은기후과학자들이그들의분야에서"성배"라고부르는것을달성했습니다:기상예보와기후모델링을완벽하게결합한1.25킬로미터해상도의지구디지털트윈입니다.​11월3일arXiv에제출된논문에자세히설명된이획기적인성과는거의킬로미터규모에서전체지구시스템의최초전지구시뮬레이션을나타내며,대기,해양,육지를통한에너지,물,탄소의흐름을포착합니다.DanielKlocke가이끄는팀은6억7천2백만개의셀을모델링했습니다—지구의육지와해양표면을덮는3억3천6백만개의셀과그위에쌓인동일한수의대기셀입니다.​전례없는컴퓨팅파워이시뮬레이션은유럽에서가장강력한두슈퍼컴퓨터에걸쳐방대한컴퓨팅리소스를필요로했습니다:스위스의Alps시스템에서8,192개의GPU와독일의JUPITER에서20,480개의GPU를사용했습니다.두시스템모두Nvidia의새로운GH200GraceHopper슈퍼칩을활용하며,이는GPU와CPU기능을결합하여모델의다양한측면을처리합니다.​연구팀은하루당145.7일의시뮬레이션을수행하는시간압축을달성했으며,거의1조개의자유도(모델이계산해야하는값의총개수)를사용했습니다.이러한성능은유사한해상도의이전대기전용시뮬레이션을능가하며,지구시스템상호작용에대한장기연구를가능하게합니다.​해상도장벽돌파하기진정한혁신은이해상도에서"빠른"지구시스템프로세스와"느린"지구시스템프로세스를결합하는데있습니다.빠른시스템에는날씨를지배하는에너지및물순환이포함되며,폭풍이개별격자셀을가로질러이동함에따라몇분마다업데이트됩니다.느린프로세스에는탄소순환,생물권변화,그리고수년또는수십년에걸쳐진화하는해양지구화학이포함됩니다.​UniverseToday에따르면,이러한복잡한시스템을통합하는일반적인모델은40킬로미터를초과하는해상도에서만계산적으로처리가능했습니다.돌파구는수십년된Fortran코드베이스를현대화한Data-CentricParallelProgramming프레임워크를사용한정교한소프트웨어엔지니어링을통해이루어졌습니다.​이연구로팀은11월18일슈퍼컴퓨팅컨퍼런스에서발표될예정인권위있는GordonBellPrizeforClimateModelling후보로지명되었습니다.
1008 조회
0 추천
2025.11.12 등록
(퍼플렉시티가정리한기사)대만의전자제품대기업폭스콘은수요일3분기실적발표에서인공지능수요에대한낙관적인전망을시사하며,다음주OpenAI협력에대한세부사항을공개할계획을밝혔고AI가2026년가장중요한성장동력이될것으로전망했다.세계최대전자제품위탁제조업체는7-9월기간동안순이익576억7천만대만달러(18억9천만달러)를기록했으며,이는전년대비17%증가한수치로애널리스트예상치인504억대만달러를상회했다.매출은11%증가한2조6백억대만달러를기록했으며,이는클라우드제공업체들이데이터센터인프라에수십억달러를쏟아붓는가운데AI서버에대한수요가급증한데따른것이다.​AI서버가아이폰을제치고매출선두로부상AI서버생산을포함하는폭스콘의클라우드및네트워킹부문은현재전체매출의42%를차지하며,AppleiPhone조립을포함하는스마트소비자전자제품부문을2분기연속앞지르고있습니다.이는소비자전자제품이폭스콘매출의54%를차지했던2021년과비교하면극적인변화를나타냅니다.​류영웨이(YoungLiu)회장은실적발표에서투자자들에게"2026년에는AI산업의발전이가장중요한성장동력이될것으로보고있습니다"라고말했습니다.그는"2026년에대해매우낙관적입니다"라고덧붙이면서도,회사가지정학적불확실성과외환변동성을모니터링할것이라고언급했습니다.​실적보고서에서폭스콘은4분기에전년대비상당한매출성장을전망했으며,AI서버매출은전분기대비증가할것으로예상했습니다.Nvidia의최대서버제조업체인이회사는Microsoft,Amazon,Alphabet의Google을포함한거대기술기업들의AI인프라에대한전례없는투자로이익을얻고있습니다.​OpenAI파트너십세부사항다음주공개예정Liu는Foxconn이다음주타이페이에서연례기술의날행사를개최할예정이며,이자리에서OpenAI와의협력에대한세부사항을발표할계획이라고밝혔다.OpenAICEOSamAltman은10월에대만을방문하여Foxconn및TaiwanSemiconductorManufacturingCompany와만나회사의Stargate프로젝트를위한AI서버인프라및칩생산에대해논의했다.​이번예고된발표는Foxconn이2002년그래픽카드용레퍼런스디자인제작을시작한이래이어온Nvidia와의기존관계를넘어AI파트너십을심화하고있음을시사한다.Foxconn은현재범용서버와AI서버모두에서전세계시장점유율약40%를차지하고있다고주장한다.
1019 조회
0 추천
2025.11.12 등록
(퍼플렉시티가정리한기사)연세대와고려대에이어서울대에서도인공지능(AI)을이용한시험부정행위가적발되며대학가전반에논란이확산하고있다.이번사태는온라인시험뿐아니라대면시험에서도AI부정행위가발생하고있음을보여주며,명문대학들이AI시대에맞는교육평가시스템마련에속수무책인상황을드러냈다.대면시험도예외없어12일서울대에따르면지난달치러진교양과목'통계학실험'중간고사에서일부학생이AI를활용해문제를푼정황이적발됐다.이강의는서울대자연대에서개설한교양과목으로약30명이수강하는대면강의다.중간고사도강의실에비치된컴퓨터를이용한대면방식으로치러졌다.​학교측은시험전AI활용을금지한다고공지했지만,조교가채점중AI사용정황을발견했다.서울대관계자는"자진신고한학생이두명있었다"며"집단적부정행위정황은발견되지않았고개인적일탈로판단하고있다"고밝혔다.서울대는해당분반의중간고사성적을무효화하고재시험을실시하기로결정했다.​앞서연세대'자연어처리와챗GPT'수업에서는600명중190명이상이비대면시험에서부정행위를한것으로알려졌다.고려대'고령사회에대한다학제적이해'과목에서도학생들이카카오톡오픈채팅방을통해답안을공유해시험이전면무효화됐다.​구조적문제지적전문가들은이번사태가개인의윤리문제를넘어구조적문제라고지적한다.대학정보공시에따르면연세대의비대면강의는2022년2학기34개에서2024년2학기321개로급증했다.한국직업능력연구원조사결과대학생의91.7%가과제나자료검색에AI를활용한다고답했지만,한국대학교육협의회에따르면전국131개대학중AI가이드라인을마련한곳은30곳(22.9%)에불과하다.​김명주바른AI센터장은"대면시험에서도부정행위가발생한것은교수들이AI의영향력을제대로인식하지못한결과일수있다"고분석했다.학생들사이에서는"정직하게시험을치른학생만손해"라는인식이확산하고있다.​가이드라인마련시급각대학은뒤늦게대책마련에나섰다.서울대는오는21일'챗GPT로숙제해도될까요'라는주제로학부생대상워크숍을개최할예정이다.연세대도조만간AI활용과윤리를주제로긴급공청회를열기로했다.유재준서울대자연대학장은"단순히정답을맞히는기존시험평가방식에서벗어나는근본적인전환이필요한시점"이라고말했다.
1093 조회
0 추천
2025.11.12 등록
(퍼플렉시티가정리한기사)새로운설문조사에따르면대다수의청취자들이더이상인간이만든음악과인공지능이완전히생성한트랙을구별할수없는것으로나타나,투명성과음악산업의미래에대한우려가제기되고있습니다.스트리밍플랫폼Deezer를위해Ipsos가실시하고수요일에발표된이설문조사는8개국의9,000명에게세개의음악클립(AI생성두개와인간제작한개)을듣고어떤것이인공적인지식별하도록요청했습니다.응답자의97%가테스트에실패했습니다.절반이상이두가지를구별할수없다는사실을알게되었을때불편함을느꼈습니다.​이조사결과는이번주AI생성컨트리송이처음으로빌보드차트정상에오르면서나왔습니다.생성형AI기술을사용하는것으로널리알려진아티스트BreakingRust의"WalkMyWalk"가월요일에발표된데이터에따르면빌보드의CountryDigitalSongSales차트에서1위를차지했습니다.​AI음악,스트리밍플랫폼에서급증Deezer는2025년내내AI생성음악이자사플랫폼에서폭발적으로증가했다고밝혔습니다.현재이서비스는매일50,000개이상의완전한AI생성트랙을받고있으며,이는전체일일업로드의34%이상을차지합니다.1월에는매일스트리밍되는트랙10개중1개가완전히AI로생성된것이었지만,10월에는그수치가3개중1개이상으로증가했습니다.​Deezer에따르면,완전히AI로생성된트랙의스트림중최대70%가사기로감지되었으며,플랫폼은이를로열티지급에서제외하고있습니다.완전히AI로생성된음악이현재Deezer의전체스트림중약0.5%만을차지하고있지만,회사는사기행위가이러한업로드의주요동기로남아있다고주장합니다.​산업투명성요구설문조사는AI생성콘텐츠에대한라벨링에대해압도적인지지를보여주었으며,응답자의80%가완전히AI로생성된음악은청취자들에게명확하게표시되어야한다는데동의했습니다.Deezer는사용자를위해완전히AI로생성된콘텐츠를체계적으로라벨링하는유일한주요음악스트리밍플랫폼입니다.​"설문조사결과는사람들이음악에관심을갖고있으며자신이듣고있는것이AI인지사람이만든트랙인지알고싶어한다는것을명확히보여줍니다"라고DeezerCEOAlexisLanternier는말했습니다.​설문응답자의70%는완전히AI로생성된음악이현재와미래의음악가들의생계를위협한다고믿으며,65%는AI모델이저작권이있는자료로학습하는것을허용해서는안된다고답했습니다.9월에Spotify는아티스트와퍼블리셔들이음악제작에서AI사용을공개하는자발적산업규약에가입하도록장려할것이라고발표했습니다.
977 조회
0 추천
2025.11.12 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입