Loading...

AI 뉴스

소니, 모델 전반의 편향성을 드러내는 윤리적 AI 데이터셋 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.06 14:04
1,141 조회
0 추천
0 비추천

본문

2192245744_rlcnht.jpg

(퍼플렉시티가 정리한 기사)


소니 AI는 화요일에 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 획기적인 동의 기반 데이터셋인 Fair Human-Centric Image Benchmark (FHIBE)를 출시했습니다. Nature에 게재된 이번 출시는 AI 시스템 전반의 공정성을 평가하기 위해 특별히 제작된 최초의 공개적으로 이용 가능한 전 세계적으로 다양한 데이터셋을 나타내며, 기존 모델 중 윤리적 기준을 완전히 충족하는 것은 없다는 사실을 밝혀냅니다.​

이 데이터셋은 81개국에서 온 1,981명의 자원자들의 10,318개 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받고 수집되었습니다. 참가자들은 언제든지 자신의 이미지를 철회할 권리를 보유하며, 이는 허가 없이 웹 데이터를 수집하는 업계 관행에서 벗어난 것입니다.​


AI 모델 전반에 걸쳐 광범위한 편향성 발견

Sony AI의 테스트는 현재 컴퓨터 비전 시스템에서 "she/her/hers" 대명사를 사용하는 개인에 대한 정확도가 낮은 것을 포함하여 지속적인 편향이 존재함을 밝혀냈습니다. 벤치마크는 이러한 격차가 부분적으로 해당 인구 집단의 더 큰 헤어스타일 다양성에서 비롯된다는 것을 확인했는데, 이는 공정성 연구에서 이전에 간과되었던 요인입니다.​

모델이 직업에 대한 중립적인 질문을 받았을 때 더 우려스러운 패턴이 나타났습니다. AI 시스템은 인구통계학적 특성에 기반하여 대상을 성 노동자, 마약 거래상 또는 도둑으로 묘사하면서 해로운 고정관념을 자주 강화했습니다. 범죄 활동에 대해 질문을 받았을 때, 모델은 아프리카계 또는 아시아계 조상을 가진 개인, 더 어두운 피부톤을 가진 사람, 그리고 "he/him/his"로 식별되는 사람들에 대해 더 높은 비율로 유해한 응답을 생성했습니다.​

Sony AI의 연구에 따르면, "기존의 대규모 언어 모델 중 FHIBE의 모든 공정성 테스트를 통과한 것은 없었으며, 이는 AI의 내재된 편향과 포용성 부족이 여전히 지속적인 문제로 남아 있음을 보여줍니다".​


새로운 업계 표준 설정

소니 그룹의 글로벌 AI 거버넌스 책임자인 Alice Xiang은 오랜 업계 관행을 해결하는 데 있어 이 데이터셋의 중요성을 강조했습니다. "업계는 너무 오랫동안 다양성이 부족하고, 편향을 강화하며, 적절한 동의 없이 수집된 데이터셋에 의존해 왔습니다"라고 그녀는 말했습니다. "이 프로젝트는 사전 동의, 개인정보 보호, 공정한 보상, 안전, 다양성 및 유용성에 대한 모범 사례를 통합한 책임 있는 데이터 수집이 가능하다는 것을 보여줍니다."​

개발 비용은 3년 동안 100만 달러 미만이었으며, Nature의 사설 보도에 따르면 "많은 기술 기업들에게는 바다의 물 한 방울"에 불과한 금액입니다. 이 비교적 적은 투자는 윤리적 데이터 수집이 엄청나게 비싸다는 업계의 주장에 이의를 제기합니다.​

소니 AI의 사장인 Michael Spranger는 이번 출시를 "AI 데이터셋에 대한 새로운 업계 기준"을 확립하는 것으로 평가하며, "데이터를 책임감 있게 수집하는 것이 가능하다는 것을 증명하고, 처음부터 신뢰할 수 있는 AI를 구축하는 데 도움이 된다"고 말했습니다.​

FHIBE 데이터셋은 현재 fairnessbenchmark.ai.sony에서 공개적으로 이용 가능하며, 전 세계 연구자와 개발자에게 컴퓨터 비전 시스템의 편향을 식별하고 완화할 수 있는 도구를 제공합니다.

댓글 0
전체 1,366 / 123 페이지
(퍼플렉시티가정리한기사)OpenAI는목요일인공지능이생물학적위협을만드는무기로전용되는것을방지하는데중점을둔스타트업인RedQueenBio에1,500만달러규모의시드라운드를주도할것이라고발표했으며,이는ChatGPT제작사의한달도안되는기간내두번째주요생물안보투자를의미한다.mRNA치료제회사인HelixNano에서분사한샌프란시스코소재이회사는잠재적인생물무기위협과같은속도로진화하는AI기반방어시스템개발을목표로하고있다.RedQueenBio는공동창립자HannuRajaniemi에따르면,생물학적시스템의취약점을식별하고대응책을설계하기위해컴퓨터모델과실험실테스트를결합할예정이다.​"생물학적역량이우리가예상했던것보다빠르게발전하고있다는것이명백했습니다"라고Rajaniemi는Reuters에말했다."우리는방어책개발을시작해야한다고느꼈습니다".​OpenAI의안전포트폴리오확장이번투자는OpenAI가지난10월뉴욕에본사를둔생물보안소프트웨어회사Valthos에3천만달러를투자한것에이어이루어졌다.OpenAI의최고전략책임자인JasonKwon은회사가유사한위험을다루는추가스타트업을지원하는데열려있다고말했다."우리는전체생태계의전반적인회복력을높이고싶습니다"라고Kwon은Reuters에말했다."위험완화를다룰수있는가장좋은방법중하나는더많은기술입니다".​이번펀딩라운드에는CerberusVentures,FiftyYears,HalcyonFutures도참여했다.거래의일환으로OpenAICEOSamAltman과이사회멤버NicoleSeligman은HelixNano에대한이전투자로인해RedQueenBio의주식을받게되지만,두사람모두이번거래승인에는참여하지않았다.OpenAI의최고컴플라이언스책임자와이해관계가없는이사회구성원들이이번투자를검토하고승인했다.​AI기반위협에맞서는경쟁레드퀸바이오는루이스캐럴의「거울나라의앨리스」에서이름을따왔으며,이는생물학적위협과방어역량간의끊임없는진화적경쟁을의미합니다.이스타트업의창립자들은오픈AI와의협업중최첨단AI모델들이놀라운생물학적창의성을보여주었으며,이는혁신적인치료법개발에활용될수있는가능성을갖는동시에,더어두운잠재력도내포하고있음을관찰했습니다.​안전전문가들은약물개발을가속화할수있는AI시스템이동시에악의적인행위자들이위험한병원체를설계하는장벽을낮출수있다고경고합니다.최근연구에서는합성단백질스크리닝과정에서의취약점이드러났고,여러AI연구소에서생물무기개발정보를제공할위험임계점에다다른모델들에대해우려를표명하고있습니다.​레드퀸바이오는선진AI모델,실험실자동화,강화학습을활용하여AI기반생물학적위협을맵핑하고미리의료대책을개발할계획입니다.이회사는퍼블릭베네핏코퍼레이션구조로설립되었으며,모든AI연구소,바이오제약회사,정부와협력할것을약속합니다.
969 조회
0 추천
2025.11.15 등록
(퍼플렉시티가정리한기사)인공지능(AI)이심혈관임상시험에서임상사건을전문의수준의정확도로성공적으로판정함으로써,신약개발의비용과복잡성을줄일수있는잠재적전환점을맞고있습니다.연구진은이번주시카고에서열린2025년미국심장협회(AmericanHeartAssociation)연례학술대회에서,AI모델이인간임상사건위원회와동등하게심근경색,뇌졸중,심혈관사망을판별할수있음을발표했습니다.​이번돌파구의중심에는대형언어모델(LargeLanguageModels)과자연어처리(NaturalLanguageProcessing)를활용한두가지첨단AI시스템이있습니다.Auto-MACE모델은PARADISE-MI임상시험에참가한5,661명을대상으로심혈관사망에대해97%,심근경색89%,뇌졸중88%의임상사건위원회와의일치도를보였습니다.한편,심부전자연어처리(HeartFailureNaturalLanguageProcessing)모델은글로벌DELIVER임상시험에서임상의와83%의전체일치도,특히심부전입원판별에서87%의일치도를기록했습니다.​비용이많이드는프로세스간소화임상사건판정은임상시험중특정의료사건이실제로발생했는지확인하는과정으로,일반적으로전문의사패널이의료기록을수작업으로검토해야합니다.이노동집약적인과정은주요비용발생원인으로작용하며,심혈관약물의규제승인임상시험참가자1인당비용이$35,000을초과하기도합니다.​"AI가사람이직접검토해야하는사례의양을줄임으로써,판정비용과일정지연의주요원인을줄일수있습니다."라고브리검여성병원(PabloM.Marti-Castellote외연구진)이그들의JACC논문에서밝혔습니다.Auto-MACE모델은사망사례의69%와잠재적뇌졸중의81%를자신있게판정했으며,불확실한사례에대해서만인간의검토가필요했습니다.​업계영향화이자,존슨앤드존슨,노바티스등제약사들은개발기간과비용감소의수혜를받을것으로보입니다.IQVIA와같은계약연구기관들은이미AI솔루션을도입하고있으며,한설문조사에따르면타당성평가에소요되는시간이90%까지줄었다고합니다.​최근업계분석에따르면,임상시험에AI를통합하면시험당최대70%의비용절감과80%의기간단축이가능하다고합니다.2030년까지AI가임상시험의60~70%에통합될것으로예상되며,이는제약업계에연간200~300억달러의비용절감효과를가져올수있습니다.​마이크로소프트와IBM등테크기업들은임상시험관리를위한AI-서비스형플랫폼개발에유리한위치에있습니다.심혈관연구재단의알렉산드라포프마는Auto-MACE의결과를"환상적"이라며,이는"AI를임상시험의일부로공식적으로도입하는과정의중요한단계"라고평가했습니다.
998 조회
0 추천
2025.11.15 등록
(퍼플렉시티가정리한기사)이번주주요엔터프라이즈소프트웨어공급업체들의일련의발표는에이전틱AI(지속적인인간감독없이의사결정을내리고행동을취할수있는자율시스템)가파일럿프로젝트에서프로덕션준비플랫폼으로이동했음을알리는신호입니다.11월13-14일,Cisco,Salesforce,NTTDATA를포함한기업들이상당한비용절감과효율성향상을약속하는이니셔티브를공개했습니다.Cisco는AICanvas플랫폼을강화하기위해소형언어모델을전문으로하는시애틀기반스타트업NeuralFabric을인수하겠다는의사를발표했습니다.회사에따르면,NeuralFabric의기술은조직이일반적인대형모델을배포하는것보다"90-99%저렴한"도메인별AI모델을구축할수있게합니다.2026년1월말까지완료될것으로예상되는이번인수는기업들이독점정보의보안을보장하면서공개데이터셋과비공개데이터를결합할수있도록함으로써데이터주권문제를해결합니다.​NTTDATA는11월14일ISGProviderLens에의해에이전틱AI서비스와생성형AI서비스부문모두에서리더로선정되었으며,이는생성형AI카테고리에서2년연속최고인정을받은것입니다.ISG보고서에따르면,회사의SmartAIAgentEcosystem은"30-50%의효율성향상,다운타임감소,고객만족도개선"을제공합니다.이생태계는인프라,오케스트레이션,개발및관찰성을아우르며,프로코드와로우코드개발을모두지원합니다.​조직변화가중심무대에오르다Kyndryl은11월13일인력전환과조직변화관리에초점을맞춘새로운자문서비스를출시했습니다.이회사의에이전틱AI프레임워크는중요한격차를해소합니다:Kyndryl의2025준비현황보고서에따르면,리더의87%가AI가1년내에일자리를재편할것으로예상하지만,인력이준비되어있다고답한비율은29%에불과합니다.​로우코드플랫폼도에이전틱기능을내장하고있습니다.Mendix는AgentsKit과AgentBuilder를도입했고,Appian은대규모에이전트배포를위한AgentStudio를발표했습니다.Deltek은"에이전틱재무마감"기능을포함하여ERP및프로젝트관리시스템전반에걸친에이전틱오케스트레이션을공개했으며,Pipefy는지능형문서처리기능을갖춘Agents2.0을출시했습니다.​데이터보호에멀티에이전트지원추가Druva는AmazonWebServices와파트너십을맺고11월14일데이터보호를위한멀티에이전트코파일럿에대해상세히발표했다.AmazonBedrockAgentCore로구축된이시스템은데이터검색,헬프데스크기능,백업작업시작과같은중요한작업을처리하는특화된에이전트들을특징으로한다.코파일럿은테스트중API선택에서91-93%의정확도를달성했으며,금융서비스사용사례에서조사시간을몇시간에서몇분으로단축했다.​글로벌에이전틱AI시장이2025년72억9천만달러에서2032년883억5천만달러로성장할것으로예상됨에따라이러한발표들이잇따르고있다.
974 조회
0 추천
2025.11.15 등록
(퍼플렉시티가정리한기사)구글은Gemini앱에새로운기능을도입한다고목요일에발표했다.이기능은사용자가최대세개의참조이미지를업로드하여AI기반영상생성에활용할수있도록한다.구글이"비주얼인그리디언트"라고부르는이업데이트는복잡한텍스트프롬프트를작성하지않아도일관된캐릭터,스타일,그리고장면을가진영상을만들수있게해준다.​이기능은구글의최신영상생성모델인Veo3.1을활용하며,기존Flow영상편집도구와함께Gemini앱에서바로사용할수있다.9to5Google에따르면,해당업데이트는목요일부터점진적으로배포되고있으며,다음주에GoogleAIPlus,Pro,Ultra구독자에게전체제공될전망이다.​비디오제작간소화시각적요소기능은세가지주요창작과제를해결합니다:다양한장면에서캐릭터일관성유지,특정질감과예술적스타일을비디오로전환,그리고사용자의맞춤제작세계와객체일치보장.Google은이기능을AI비디오생성에전통적으로필요했던길고복잡한텍스트프롬프트에대한의존도를줄이는방법으로포지셔닝하고있습니다.​참조이미지는캐릭터,객체,스타일또는장면을묘사할수있으며,Veo3.1은사용자의텍스트지침에따라이를생성된비디오에통합합니다.이접근방식은5월출시이후2억7,500만개이상의비디오를제작하는데사용된Google의전용AI영화제작도구인Flow에서이미사용가능한기능을반영합니다.​10월중순에출시된Veo3.1은이전버전에비해더풍부한오디오생성,더강력한프롬프트준수,그리고더나은이미지-비디오변환품질을포함한여러개선사항을제공합니다.이모델은이제비디오와함께동기화된오디오를생성할수있으며여러샷에걸쳐캐릭터일관성을유지하기위해참조이미지를지원합니다.​구독및경쟁시각적재료기능은구글의AI플러스,프로,울트라요금제가입자들에게제공될예정입니다.구글AI프로는월20달러이며,울트라는월249.99달러이고가장높은사용한도와Veo3에대한접근권한이포함되어있습니다.회사의Gemini앱은최근월간활성사용자수가6억5천만명을돌파했으며,이는3월의3억5천만명에서증가한수치입니다.​이번업데이트는구글이AI영상생성분야에서점점치열해지는경쟁에직면한가운데이루어진것입니다.최근오픈AI가Sora2를출시했고,메타는MovieGen도구를개발중입니다.구글또한최근100만달러상금의AI영화대회를발표했으며,참가자는최소70%이상구글AI로생성한콘텐츠를사용해야합니다.
970 조회
0 추천
2025.11.15 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입