Loading...

AI 뉴스

연구들이 AI 훈련 데이터와 테스트의 결함을 드러내다

페이지 정보

작성자 xtalfi
작성일 2025.11.07 14:52
1,617 조회
0 추천
0 비추천

본문

251105-ai-safety-tests-lr-10661e.jpg

(퍼플렉시티가 정리한 기사)


이번 주에 발표된 두 가지 주요 연구는 인공지능 시스템이 구축되고 평가되는 방식의 심각한 약점을 드러내며, AI 능력이 과장되어 왔는지에 대한 의문을 제기하고 있다.

Sony AI는 11월 5일 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 데이터셋인 Fair Human-Centric Image Benchmark를 공개했으며, 옥스퍼드 인터넷 연구소와 영국 정부의 AI 보안 연구소 연구원들은 AI 성능을 측정하는 데 사용되는 테스트의 광범위한 결함을 밝히는 연구를 발표했다. 이러한 연구 결과들은 많은 AI 시스템이 윤리적으로 문제가 있는 데이터로 훈련되고 신뢰할 수 없는 방법으로 평가될 수 있음을 시사한다.​


훈련 데이터에 동의와 다양성이 부족함

Sony AI가 Nature에 발표한 새로운 벤치마크는 연구자들이 컴퓨터 비전 시스템에서 "편향되고 윤리적으로 문제가 있는 학습 데이터의 지속적인 과제"라고 부르는 문제를 다룹니다. 이 데이터셋은 81개국 1,981명의 개인이 찍힌 10,318장의 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받아 수집되었습니다—이는 업계 관행과 크게 다른 방식입니다.​

Sony Group의 AI 거버넌스 글로벌 책임자인 Alice Xiang은 컴퓨터 비전이 객관적이지 않다고 강조했습니다. "컴퓨터 비전은 학습 데이터에 반영된 편향에 따라 사물을 왜곡할 수 있습니다"라고 그녀는 말했습니다. 데이터셋은 기존 AI 모델 중 공정성 테스트를 완전히 통과한 모델이 없다는 것을 보여주었습니다. 일부 모델은 "she/her/hers" 대명사를 사용하는 사람들에 대해 낮은 정확도를 보였으며, 벤치마크는 이를 더 큰 헤어스타일 변동성—이전에 간과되었던 요인—으로 추적했습니다. 직업에 대한 중립적인 질문을 받았을 때, 테스트된 모델들은 특정 인구통계학적 그룹에 대해 특히 고정관념을 강화했으며, 때로는 피사체를 성매매 종사자, 마약상 또는 도둑으로 묘사했습니다.​


벤치마크 테스트가 신뢰할 수 없고 오해의 소지가 있는 것으로 밝혀짐

옥스퍼드 연구팀은 445개 AI 벤치마크를 조사한 결과, 거의 모든 벤치마크에 기술 기업들이 주장하는 결과의 신뢰성을 "약화시키는 결함"이 있음을 발견했습니다. 벤치마크 중 통계적 테스트를 통해 신뢰성을 증명한 것은 16%에 불과했습니다.​

핵심적인 문제는 구성 타당성(construct validity), 즉 테스트가 실제로 그들이 측정한다고 주장하는 것을 제대로 측정하는지에 관한 것입니다. 옥스퍼드 인터넷 연구소의 수석 연구원인 아담 마디(Adam Mahdi)는 NBC 뉴스와의 인터뷰에서, 그레이드 스쿨 매스 8K(Grade School Math 8K) 벤치마크와 같은 테스트에서 모델이 좋은 성과를 거둔다고 해서 반드시 추론 능력을 보여준다고 할 수는 없다고 말했습니다. 그는 "1학년 학생에게 '2 더하기 5가 뭐야?'라고 물었을 때 '7이에요'라고 답하면, 분명 정답입니다. 하지만 이로부터 5학년이 수학적 추론을 완벽하게 습득했다고 결론지을 수 있을까요?"라고 덧붙였습니다.​

이번 연구는 데이터 오염(data contamination)을 주요 문제로 지적했는데, 이는 테스트 문항이 모델의 학습 데이터셋에 포함되어 있어 모델이 답을 추론하는 것이 아니라 암기해서 답을 내는 현상입니다. Mixtral, Phi-3, Gemma를 포함한 여러 모델은 GSM8K 벤치마크와 유사한 신규 문항으로 평가할 때 성능이 최대 13%까지 저하되는 것으로 나타났습니다.​

옥스퍼드 연구의 수석 저자인 앤드루 빈(Andrew Bean)은 업계에서 내놓는 주장들을 그대로 믿어서는 안 된다고 경고했습니다. "모델이 박사 수준의 지능을 가졌다는 것 같은 이야기를 볼 때는 한 번쯤 의심해볼 필요가 있습니다,"라고 빈은 NBC 뉴스에 말했습니다. 이번 연구 결과는 최근 구글이 자사의 Gemma AI 모델이 미국 상원의원에 관한 허위 주장을 생성한 후에 모델을 철회한 상황에서 나왔습니다.

댓글 0
전체 1,366 / 12 페이지
으아.. 애플이 아이폰에 제미나이를 쓰겠다고 하네요..그럼 정말 안드로이드 폰하고 뭐가 달라질라나...Apple picks Google’s Gemini AI for its big Siri upgrade애플은 올해 출시될 더욱 개인화된 시리(Siri)에 구글의 제미니(Gemini) AI 모델을 적용할 예정이다.구글과 애플은 월요일에 "신중한 평가 끝에 애플은 구글의 AI 기술이 애플 파운데이션 모델(Foundation Models)에 가장 적합한 기반을 제공한다고 판단했으며,이를 통해 애플 사용자들에게 혁신적인 새로운 경험을 제공할 수 있게 되어 기쁘다"고 발표했다 .최초 보도는 cnbchttps://www.cnbc.com/2026/01/12/apple-google-ai-siri-gemini.html“After careful evaluation, we determined that Google’s technology provides the most capable foundation for Apple Foundation Models and we’re excited about the innovative new experiences it will unlock for our users,” Apple said in astatementMonday.
723 조회
0 추천
2026.01.13 등록
Executive Summary• 구글이 일부 의료 관련 검색어에 대한 AI 오버뷰 기능을 비활성화함• 가디언 조사에서 췌장암 환자에게 '위험한' 잘못된 식이요법 조언 제공 사실 확인• 간 기능 검사 관련 허위 정보로 심각한 간 질환 환자가 건강하다고 오인할 수 있는 문제 발생• 구글은 대부분의 정보가 정확하다고 주장하나, 문제 있는 결과에 대해서는 개선 조치 진행 중Background구글의 AI 오버뷰 기능은 2024년 출시 이후 지속적인 논란에 휩싸여 왔다. 피자에 접착제를 넣으라는 조언, 돌을 먹으라는 권고 등 황당한 오류가 알려지면서 여러 건의 소송까지 제기된 바 있다. 이번에는 의료 정보라는 민감한 영역에서 심각한 오류가 발견되어 더욱 큰 우려를 낳고 있다.Impact & Implications사용자 안전 문제AI가 생성한 의료 정보의 부정확성은 단순한 불편을 넘어 환자의 생명과 직결될 수 있다. 췌장암 환자에게 고지방 식품을 피하라는 조언은 전문가들이 권고하는 내용과 정반대이며, 환자의 사망 위험을 높일 수 있다고 경고된다. 간 기능 검사 정보의 오류 역시 심각한 간 질환 환자가 치료 시기를 놓치게 만들 수 있는 위험한 문제다.AI 신뢰성에 대한 근본적 의문이번 사태는 대형 기술 기업의 AI 서비스가 고위험 영역에서 얼마나 신뢰할 수 있는지에 대한 근본적인 의문을 제기한다. 구글은 "대다수의 AI 오버뷰가 정확한 정보를 제공한다"고 주장하지만, 의료 분야에서는 소수의 오류도 치명적인 결과로 이어질 수 있다.규제 및 책임 논의 가속화AI 생성 콘텐츠의 정확성과 책임 소재에 대한 규제 논의가 더욱 활발해질 전망이다. 특히 의료, 법률 등 전문 분야에서 AI 정보 제공에 대한 가이드라인 마련이 시급해 보인다.Key Data & Facts항목수치/내용발생 시점2026년 1월문제 발견 경로가디언 탐사보도주요 오류 사례췌장암 식이요법, 간 기능 검사 수치구글 대응일부 의료 검색어 AI 오버뷰 비활성화기존 논란피자 접착제, 돌 섭취 권고 등Key Quote"We invest significantly in the quality of AI Overviews, particularly for topics like health, and the vast majority provide accurate information."— Davis Thompson, 구글 대변인
712 조회
0 추천
2026.01.12 등록
Executive Summary • xAI의 Grok 챗봇이 동의 없는 성적 딥페이크 이미지를 대량 생성해 국제적 논란 확산 • 영국, 프랑스, 인도, 말레이시아 등 각국 정부가 조사 및 규제 검토에 착수 • 미국 CSAM 및 딥페이크 관련 법률의 AI 적용 가능 여부에 법조계 의견 분분 • 머스크의 트럼프 행정부와의 긴밀한 관계가 미국 내 규제 집행에 변수로 작용 Background 일론 머스크의 AI 기업 xAI가 개발한 챗봇 Grok은 2025년부터 성적 이미지 생성 관련 논란에 휘말려왔다. 지난주 X(구 트위터)에 도입된 이미지 편집 기능으로 사용자들이 원본 게시자의 동의 없이 사진을 수정할 수 있게 되면서, 여성과 미성년자의 옷을 벗기는 딥페이크 이미지가 플랫폼에 범람하기 시작했다. 한 추정에 따르면 최고조 시점에 분당 1건의 비동의 성적 이미지가 생성됐다. Impact & Implications 규제/정책 영향 각국 정부의 대응이 빠르게 전개되고 있다. 영국의 키어 스타머 총리는 해당 콘텐츠를 "역겨운 것"이라 규정하며 "모든 옵션을 검토하겠다"고 밝혔다. 영국 통신규제기관 Ofcom은 온라인안전법 위반 여부를 조사 중이다. 유럽연합 집행위원회는 Grok의 결과물이 "불법이며 끔찍하다"고 논평했고, 인도 IT부는 불법 콘텐츠 방지 조치를 보고하도록 xAI에 명령했다. 법적 쟁점과 한계 미국 법률의 AI 적용에는 상당한 불확실성이 존재한다. 미 법무부는 "실제 미성년자와 구별할 수 없는 디지털 이미지"를 금지하고 있으며, 2025년 5월 트럼프 대통령이 서명한 Take It Down Act는 AI 생성 성적 이미지를 금지한다. 그러나 조지워싱턴대 로스쿨의 메리 앤 프랭크스 교수는 "상당히 모호하다"고 지적하며, 비키니를 입힌 미성년자 이미지가 현행 CSAM 법률을 위반하는지는 불분명하다고 설명했다. 플랫폼 면책 조항인 섹션 230이 AI 생성 콘텐츠에도 적용되는지도 미지수다. 정치적 변수 머스크와 트럼프 행정부의 긴밀한 관계가 규제 집행의 변수로 떠오르고 있다. 머스크가 운영했던 정부효율부(DOGE)가 한때 FTC 내부에서 활동했던 점, 그리고 트럼프 행정부가 미국 인터넷 플랫폼에 대한 해외 규제를 무역 협상에서 억제해온 점이 주목된다. 머스크는 해당 논란에 대해 웃음 이모지로 반응하거나 "표현의 자유 탄압"이라며 반박하는 등 심각성을 축소하는 태도를 보이고 있다. Key Data & Facts 항목수치/내용 이미지 생성 속도분당 약 1건 (최고조 시점) Take It Down Act 시행일2025년 5월 (유예기간 2026년 5월까지) 규제 검토 국가영국, EU, 프랑스, 인도, 말레이시아, 호주, 브라질 Grok 4 모델카드 공개 지연출시 후 1개월 이상 소요 Key Quote "이것은 미국 사회, 그리고 전 세계 대부분의 사회에 만연한 여성혐오를 표출하는 도구입니다. 이는 프라이버시 침해이자 동의와 경계의 침해이며, 극도로 침습적이고, 어떤 의미에서는 젠더 기반 폭력의 한 형태입니다." — 리아나 페퍼콘, 스탠포드 인간중심AI연구소(HAI) 정책 펠로우
724 조회
0 추천
2026.01.11 등록
Executive Summary • OpenAI가 외부 하청업체에게 현재 또는 이전 직장에서 수행한 실제 업무 과제와 산출물을 업로드하도록 요청하고 있음 • 이 데이터는 차세대 AI 모델의 성능을 평가하고, 인간 전문가와 AI의 업무 수행 능력을 비교하는 데 활용될 예정 • 하청업체가 기밀정보와 개인정보를 직접 삭제해야 하는 방식이어서 영업비밀 유출 및 법적 분쟁 우려 제기됨 Background OpenAI는 2024년 9월부터 자사 AI 모델의 성능을 인간 전문가와 비교·측정하는 새로운 평가 체계를 도입했다. 이는 '경제적으로 가치 있는 대부분의 과업에서 인간을 능가하는 AI 시스템', 즉 AGI(범용인공지능) 달성 진척도를 파악하기 위한 핵심 지표로 활용되고 있다. AI 기업들은 고품질 학습 데이터 확보를 위해 Surge, Mercor, Scale AI 등 외부 업체와 대규모 계약을 맺어왔으며, 이 시장은 Handshake AI의 35억 달러, Surge의 250억 달러 기업가치 평가에서 보듯 급성장 중이다. Impact & Implications 법적·윤리적 리스크 지식재산권 전문 변호사 에반 브라운은 이러한 방식이 영업비밀 침해 소송의 빌미가 될 수 있다고 경고했다. 하청업체 직원들이 이전 고용주의 비밀유지계약(NDA)을 위반하거나 영업비밀을 노출할 위험이 있기 때문이다. AI 기업이 기밀정보 판별 책임을 개별 하청업체에 전가하는 구조는 상당한 법적 리스크를 수반한다. AI 에이전트 경쟁 심화 OpenAI, Anthropic, Google 등 주요 AI 기업들이 기업 업무 자동화가 가능한 AI 에이전트 개발에 박차를 가하고 있다. 실제 업무 데이터를 활용한 학습은 AI 에이전트가 현실 세계의 복잡한 업무를 처리하는 데 필수적이며, 이번 사례는 그 데이터 확보 전략의 일면을 보여준다. 데이터 조달 방식의 진화 WIRED 취재에 따르면 OpenAI는 폐업 기업의 내부 문서, 이메일 등 데이터 구매도 타진한 것으로 알려졌다. AI 학습용 고품질 데이터 확보 경쟁이 점점 더 공격적인 방향으로 전개되고 있음을 시사한다. Key Data & Facts 항목수치/내용 Handshake AI 기업가치35억 달러 (2022년) Surge 추정 기업가치250억 달러 (2024년 하반기) 평가 프로세스 도입 시기2024년 9월 요청 문서 형태Word, PDF, PowerPoint, Excel, 이미지, 코드 저장소 등 Key Quote "AI 연구소가 기밀 정보 판단을 하청업체에 전적으로 맡기고 있다. 만약 무언가 빠져나간다면, AI 연구소가 그것이 영업비밀인지 아닌지 판별하는 데 충분한 시간을 들이고 있을까? AI 연구소가 스스로를 큰 위험에 노출시키는 것 같다." — 에반 브라운, 지식재산권 변호사
767 조회
0 추천
2026.01.11 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입