Loading...

AI 뉴스

연구들이 AI 훈련 데이터와 테스트의 결함을 드러내다

페이지 정보

작성자 xtalfi
작성일 2025.11.07 14:52
1,120 조회
0 추천
0 비추천

본문

251105-ai-safety-tests-lr-10661e.jpg

(퍼플렉시티가 정리한 기사)


이번 주에 발표된 두 가지 주요 연구는 인공지능 시스템이 구축되고 평가되는 방식의 심각한 약점을 드러내며, AI 능력이 과장되어 왔는지에 대한 의문을 제기하고 있다.

Sony AI는 11월 5일 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 데이터셋인 Fair Human-Centric Image Benchmark를 공개했으며, 옥스퍼드 인터넷 연구소와 영국 정부의 AI 보안 연구소 연구원들은 AI 성능을 측정하는 데 사용되는 테스트의 광범위한 결함을 밝히는 연구를 발표했다. 이러한 연구 결과들은 많은 AI 시스템이 윤리적으로 문제가 있는 데이터로 훈련되고 신뢰할 수 없는 방법으로 평가될 수 있음을 시사한다.​


훈련 데이터에 동의와 다양성이 부족함

Sony AI가 Nature에 발표한 새로운 벤치마크는 연구자들이 컴퓨터 비전 시스템에서 "편향되고 윤리적으로 문제가 있는 학습 데이터의 지속적인 과제"라고 부르는 문제를 다룹니다. 이 데이터셋은 81개국 1,981명의 개인이 찍힌 10,318장의 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받아 수집되었습니다—이는 업계 관행과 크게 다른 방식입니다.​

Sony Group의 AI 거버넌스 글로벌 책임자인 Alice Xiang은 컴퓨터 비전이 객관적이지 않다고 강조했습니다. "컴퓨터 비전은 학습 데이터에 반영된 편향에 따라 사물을 왜곡할 수 있습니다"라고 그녀는 말했습니다. 데이터셋은 기존 AI 모델 중 공정성 테스트를 완전히 통과한 모델이 없다는 것을 보여주었습니다. 일부 모델은 "she/her/hers" 대명사를 사용하는 사람들에 대해 낮은 정확도를 보였으며, 벤치마크는 이를 더 큰 헤어스타일 변동성—이전에 간과되었던 요인—으로 추적했습니다. 직업에 대한 중립적인 질문을 받았을 때, 테스트된 모델들은 특정 인구통계학적 그룹에 대해 특히 고정관념을 강화했으며, 때로는 피사체를 성매매 종사자, 마약상 또는 도둑으로 묘사했습니다.​


벤치마크 테스트가 신뢰할 수 없고 오해의 소지가 있는 것으로 밝혀짐

옥스퍼드 연구팀은 445개 AI 벤치마크를 조사한 결과, 거의 모든 벤치마크에 기술 기업들이 주장하는 결과의 신뢰성을 "약화시키는 결함"이 있음을 발견했습니다. 벤치마크 중 통계적 테스트를 통해 신뢰성을 증명한 것은 16%에 불과했습니다.​

핵심적인 문제는 구성 타당성(construct validity), 즉 테스트가 실제로 그들이 측정한다고 주장하는 것을 제대로 측정하는지에 관한 것입니다. 옥스퍼드 인터넷 연구소의 수석 연구원인 아담 마디(Adam Mahdi)는 NBC 뉴스와의 인터뷰에서, 그레이드 스쿨 매스 8K(Grade School Math 8K) 벤치마크와 같은 테스트에서 모델이 좋은 성과를 거둔다고 해서 반드시 추론 능력을 보여준다고 할 수는 없다고 말했습니다. 그는 "1학년 학생에게 '2 더하기 5가 뭐야?'라고 물었을 때 '7이에요'라고 답하면, 분명 정답입니다. 하지만 이로부터 5학년이 수학적 추론을 완벽하게 습득했다고 결론지을 수 있을까요?"라고 덧붙였습니다.​

이번 연구는 데이터 오염(data contamination)을 주요 문제로 지적했는데, 이는 테스트 문항이 모델의 학습 데이터셋에 포함되어 있어 모델이 답을 추론하는 것이 아니라 암기해서 답을 내는 현상입니다. Mixtral, Phi-3, Gemma를 포함한 여러 모델은 GSM8K 벤치마크와 유사한 신규 문항으로 평가할 때 성능이 최대 13%까지 저하되는 것으로 나타났습니다.​

옥스퍼드 연구의 수석 저자인 앤드루 빈(Andrew Bean)은 업계에서 내놓는 주장들을 그대로 믿어서는 안 된다고 경고했습니다. "모델이 박사 수준의 지능을 가졌다는 것 같은 이야기를 볼 때는 한 번쯤 의심해볼 필요가 있습니다,"라고 빈은 NBC 뉴스에 말했습니다. 이번 연구 결과는 최근 구글이 자사의 Gemma AI 모델이 미국 상원의원에 관한 허위 주장을 생성한 후에 모델을 철회한 상황에서 나왔습니다.

댓글 0
전체 1,366 / 129 페이지
(퍼플렉시티가 정리한 기사)Google DeepMind는 목요일에 SIMA 2를 발표했습니다. 이는 회사의 Gemini 언어 모델을 통합하여 3D 가상 환경을 탐색하고 상호작용하는 차세대 AI 에이전트로, 연구원들이 인공 일반 지능과 실제 로보틱스 응용 분야를 향한 진전이라고 설명하는 것을 나타냅니다.DeepMind에 따르면, 이 새로운 에이전트는 전작 대비 성능이 크게 향상되어 복잡한 작업의 성공률을 두 배로 높였습니다. 원래 SIMA가 어려운 과제에서 인간 플레이어의 71%에 비해 31%의 완료율만 달성한 반면, SIMA 2는 Gemini 2.5 Flash-lite 통합을 통해 향상된 기능을 보여줍니다.향상된 추론 및 자기 개선SIMA 2는 단순한 지시 따르기를 넘어 맥락을 이해하고, 목표에 대해 추론하며, 사용자와 대화할 수 있다고 DeepMind의 선임 연구 과학자 Joe Marino가 기자 브리핑에서 설명했다. 이 에이전트는 이모지를 포함한 멀티모달 프롬프트를 해석할 수 있으며—“????????”와 같은 명령에 나무를 베어 넘어뜨리는 것으로 반응한다—작업을 해결할 때 내부 추론 과정을 보여준다.이 에이전트는 No Man’s Sky, Valheim, Goat Simulator 3 등 다양한 상용 비디오 게임에서 훈련되었으며, 화면 픽셀과 가상 키보드 및 마우스 컨트롤만을 사용하여 600개 이상의 동작을 실행하는 방법을 학습했다. DeepMind는 또한 자사의 월드 모델인 Genie 3가 생성한 사실적인 세계에서 SIMA 2를 테스트했으며, 에이전트는 완전히 새로운 환경에서 성공적으로 탐색하고 작업을 완료했다.아마도 가장 주목할 만한 점은 SIMA 2의 자기 개선 능력이다. 전적으로 인간 게임플레이 데이터에 의존했던 SIMA 1과 달리, 새로운 시스템은 Gemini 모델을 사용하여 작업을 생성하고 자체 성능을 평가하며, 인간의 개입보다는 AI 기반 피드백을 통한 시행착오로 학습한다.물리적 로봇공학으로 가는 길DeepMind는 SIMA 2를 범용 로봇을 위한 기초적인 기술로 제시하고 있습니다. “로봇과 같이 실제 세계에서 작업을 수행하기 위해 시스템이 해야 할 일을 생각해보면 두 가지 구성 요소가 있습니다”라고 DeepMind의 수석 연구 엔지니어인 Frederic Besse는 말했습니다. “첫째, 실제 세계에 대한 높은 수준의 이해와 수행해야 할 작업, 그리고 약간의 추론이 필요합니다”.그러나 전문가들은 신중한 입장을 표명하고 있습니다. 뉴욕 대학교의 AI 연구원인 Julian Togelius는 결과가 흥미롭다고 평가하면서도, 시각적 관찰만으로 여러 게임에 걸쳐 모델을 훈련시키는 것은 여전히 어려운 과제라고 지적합니다. 앨버타 대학교의 Matthew Guzdial은 로봇공학에 얼마나 많은 지식이 전이될 수 있을지 의문을 제기하며, 실제 세계의 카메라 영상을 이해하는 것이 인간 플레이어를 위해 설계된 게임 그래픽을 해석하는 것보다 훨씬 더 복잡하다고 언급했습니다.DeepMind는 SIMA 2를 소수의 학계 및 게임 개발자 그룹에게 제한된 연구 프리뷰로 공개하고 있습니다.
1107 조회
0 추천
2025.11.14 등록
(퍼플렉시티가 정리한 기사)Liquid AI는 수요일에 Shopify [ -6.55%]와 다년간의 파트너십을 발표하며, 전자상거래 플랫폼 전반에 걸쳐 Liquid Foundation Models를 배포할 예정이라고 밝혔습니다. 이는 20밀리초 미만의 AI 모델을 대규모로 상용 배포하는 첫 사례 중 하나입니다.매사추세츠주 케임브리지에 본사를 둔 이 스타트업은 검색 및 멀티모달 애플리케이션을 포함하여 Shopify 플랫폼의 품질 민감 워크플로우를 위해 자사의 주력 모델을 라이선스할 예정입니다. 첫 번째 프로덕션 배포는 수백만 명의 판매자와 쇼핑객을 위한 검색 기능을 향상시키는 20밀리초 미만의 텍스트 모델입니다.새로운 아키텍처를 통한 성능 향상Liquid AI에 따르면, 이 회사의 모델은 인기 있는 오픈소스 대안들보다 훨씬 적은 매개변수를 사용하면서도 더 빠른 추론 시간을 달성합니다. 특정 실제 운영 환경과 유사한 작업에서, 약 50% 더 적은 매개변수를 가진 LFM은 알리바바의 Qwen3, 구글의 Gemma3, 메타의 Llama 3와 같은 모델들을 능가했으며, 2배에서 10배 더 빠른 추론을 제공했습니다.“이와 같은 실제 워크로드에서 20ms 미만의 추론을 제공하는 곳은 아무도 없습니다”라고 Shopify의 최고기술책임자인 Mikhail Parakhin이 성명에서 밝혔습니다. 2024년 9월 마이크로소프트에서 AI 개발을 이끈 후 Shopify에 합류한 Parakhin은 이 아키텍처가 “품질을 희생하지 않고” 효율성을 제공한다고 덧붙였습니다.이 파트너십은 2024년 12월 Liquid AI의 2억 5천만 달러 규모 시리즈 A 펀딩 라운드에 Shopify가 참여한 것을 기반으로 합니다. 이 펀딩은 칩 제조업체 AMD가 주도했으며, 이 스타트업의 가치를 20억 달러 이상으로 평가했습니다.추천 시스템이 초기 결과를 보여줍니다두 회사는 새로운 HSTU 아키텍처를 사용하여 생성형 추천 시스템을 공동 개발했습니다. 통제된 테스트에서 이 모델은 Shopify의 이전 시스템을 능가했으며, 발표에 따르면 추천을 통한 전환율이 더 높아졌습니다.Liquid AI의 CEO인 Ramin Hasani는 “추천은 금융, 의료, 전자상거래 분야의 의사결정 백본입니다”라고 말했습니다. “실제 세계에서 유용하려면 모델은 신뢰할 수 있고, 효율적이며, 빨라야 합니다.”파트너십에는 저지연 Shopify 워크로드 전반에 걸친 LFM의 다목적 라이선스, 지속적인 연구 개발 협력, 공유 로드맵이 포함됩니다. 초기 배포는 검색을 위한 텍스트 모델에 중점을 두고 있지만, 두 회사는 고객 프로필, 에이전트, 제품 분류를 포함한 추가 사용 사례를 위해 멀티모달 모델을 평가하고 있습니다.[파트너십의 재정적 조건은 공개되지 않았습니다. 이 협력은 Liquid AI가 미세한 벌레의 신경 구조에서 영감을 받아 MIT에서 개발한 액체 신경망 기술을 전자상거래, 금융 서비스 및 기타 분야의 상용 생산에 도입하려는 노력을 나타냅니다.
1086 조회
0 추천
2025.11.14 등록
(퍼플렉시티가정리한기사)AI보안회사Mindgard가11월12일공개한보고서에따르면,OpenAI의Sora2비디오생성모델의취약점으로인해공격자가오디오전사를통해숨겨진시스템프롬프트를추출할수있다고합니다.이번발견은텍스트,이미지,비디오,오디오간의변환이정보유출을위한예상치못한경로를만드는멀티모달AI시스템의새로운보안과제를강조합니다.​오디오전사가보안장치를우회합니다AaronPortnoy가이끄는Mindgard연구원들은11월3일Sora2를대상으로실험을시작했으며,15초길이의짧은클립으로음성을생성하는것이모델의기초명령어를복구하는가장충실도높은방법임을발견했습니다.전통적인시각적방법은이미지와비디오프레임에렌더링된텍스트가시퀀스전반에걸쳐빠르게왜곡되어글자가읽을수없는근사치로변형되면서실패했습니다.QR코드와같은인코딩된형식역시똑같이신뢰할수없는것으로판명되었으며,Mindgard의보고서에따르면"시각적으로는그럴듯하지만디코딩가능한횡설수설"을생성했습니다.​획기적인발견은연구원들이Sora2에게시스템프롬프트의일부를말하도록요청했을때이루어졌으며,시간제한내에더많은내용을담기위해종종가속화된속도로진행되었습니다.이러한오디오클립을전사하고조각들을이어붙임으로써,그들은메타데이터를먼저생성하고,명시적으로요청되지않는한저작권이있는캐릭터를피하며,성적으로암시적인콘텐츠를금지하는등의규칙을드러내는거의완전한시스템프롬프트를재구성했습니다.​AI보안에대한광범위한영향OpenAI는11월4일다중모달시스템전반의프롬프트추출위험에대한일반적인인식을언급하며이취약점을인정했다.Sora2의시스템프롬프트자체에는매우민감한데이터가포함되어있지않지만,보안연구원들은시스템프롬프트가행동가드레일로기능하며구성비밀로취급되어야한다고강조한다.Mindgard는보고서에서"시스템프롬프트는모델안전경계를정의하며,유출될경우후속공격을가능하게할수있다"고밝혔다.​이취약점은다중모달모델의고유한약점을악용하는데,변환과정에서의미적표류가누적된다.AI시스템이여러데이터유형을처리함에따라시스템지침을보호하는것이점점더어려워지고있다.Mindgard는개발자들이시스템프롬프트를독점정보로취급하고,오디오및비디오출력에서유출을테스트하며,생성물에길이제한을구현할것을권장한다.​이번공개는9월말에출시된Sora2에대한광범위한조사가이루어지는가운데나왔다.PublicCitizen은11월11일딥페이크와유해콘텐츠에대한우려를이유로OpenAI에이도구를임시철회할것을촉구했다.OpenAI는Sora2에여러안전계층이포함되어있다고주장해왔지만,비평가들은그효과에의문을제기하고있다.
1021 조회
0 추천
2025.11.14 등록
(퍼플렉시티기정리한기사)부산대학교와서울대학교의연구진들이올해저명한통계학저널에발표한연구결과에따르면,데이터왜곡에대항하여인공지능및의료영상시스템을강화할수있는새로운통계적방법을개발했습니다.휴버평균(Hubermean)이라고불리는이방법은현대데이터과학의지속적인과제를다룹니다:평평한표면이아닌곡면기하학적공간에존재하는정보를분석하는것입니다.3차원의료스캔부터로봇방향데이터에이르기까지,오늘날의복잡한데이터대부분은수학자들이리만다양체라고부르는공간에존재하며,여기서전통적인통계도구들은노이즈나이상치에직면했을때종종실패합니다.​정확한분석을위한장벽허물기부산대학교통계학과이종민교수는서울대학교정성규교수와함께2025년8월25일JournaloftheRoyalStatisticalSociety:SeriesB에연구를발표했다.​연구발표에따르면이교수는"우리연구는리만다양체에서고전적인프레셰평균의강건한일반화를소개한다"며"이는이상치에대한더큰안정성을제공하고기하학적데이터에대한통계분석의신뢰성을향상시킨다"고말했다.​Huber평균은데이터구조에자동으로적응하여,일반적인관측값에대해서는최소제곱손실을사용하고큰편차에대해서는절대편차손실을사용한다.이러한균형을통해0.5의붕괴점을달성할수있으며,이는데이터의절반이이상치이거나극단값이더라도추정량이신뢰할수있음을의미한다.​산업전반의응용분야이방법의잠재적응용분야는과학및공학분야전반에걸쳐확장됩니다.의료영상분야에서Huber평균은뇌나장기형상데이터의평균화를개선하여더정확한진단으로이어질수있습니다.로봇공학분야에서는시스템이소음이많거나예측불가능한환경에서도움직임및방향데이터를더잘해석하는데도움이될수있습니다.AI및머신러닝분야에서는기하학적데이터를다루는모델을더견고하게만들수있습니다.​이교수는"강건하고기하학적으로인식하는데이터분석의기반을제공함으로써,이연구는신뢰할수있는차세대AI,정밀의료,그리고실제세계와상호작용하는지능형기술을조용히뒷받침할수있을것"이라고덧붙였습니다.​이연구는추정량의존재성,유일성,수렴성,불편성에대한이론적보장과함께실제로빠르게수렴하는새로운계산알고리즘을제공합니다.
1106 조회
0 추천
2025.11.14 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입