Loading...

AI 뉴스

연구들이 AI 훈련 데이터와 테스트의 결함을 드러내다

페이지 정보

작성자 xtalfi
작성일 2025.11.07 14:52
1,536 조회
0 추천
0 비추천

본문

251105-ai-safety-tests-lr-10661e.jpg

(퍼플렉시티가 정리한 기사)


이번 주에 발표된 두 가지 주요 연구는 인공지능 시스템이 구축되고 평가되는 방식의 심각한 약점을 드러내며, AI 능력이 과장되어 왔는지에 대한 의문을 제기하고 있다.

Sony AI는 11월 5일 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 데이터셋인 Fair Human-Centric Image Benchmark를 공개했으며, 옥스퍼드 인터넷 연구소와 영국 정부의 AI 보안 연구소 연구원들은 AI 성능을 측정하는 데 사용되는 테스트의 광범위한 결함을 밝히는 연구를 발표했다. 이러한 연구 결과들은 많은 AI 시스템이 윤리적으로 문제가 있는 데이터로 훈련되고 신뢰할 수 없는 방법으로 평가될 수 있음을 시사한다.​


훈련 데이터에 동의와 다양성이 부족함

Sony AI가 Nature에 발표한 새로운 벤치마크는 연구자들이 컴퓨터 비전 시스템에서 "편향되고 윤리적으로 문제가 있는 학습 데이터의 지속적인 과제"라고 부르는 문제를 다룹니다. 이 데이터셋은 81개국 1,981명의 개인이 찍힌 10,318장의 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받아 수집되었습니다—이는 업계 관행과 크게 다른 방식입니다.​

Sony Group의 AI 거버넌스 글로벌 책임자인 Alice Xiang은 컴퓨터 비전이 객관적이지 않다고 강조했습니다. "컴퓨터 비전은 학습 데이터에 반영된 편향에 따라 사물을 왜곡할 수 있습니다"라고 그녀는 말했습니다. 데이터셋은 기존 AI 모델 중 공정성 테스트를 완전히 통과한 모델이 없다는 것을 보여주었습니다. 일부 모델은 "she/her/hers" 대명사를 사용하는 사람들에 대해 낮은 정확도를 보였으며, 벤치마크는 이를 더 큰 헤어스타일 변동성—이전에 간과되었던 요인—으로 추적했습니다. 직업에 대한 중립적인 질문을 받았을 때, 테스트된 모델들은 특정 인구통계학적 그룹에 대해 특히 고정관념을 강화했으며, 때로는 피사체를 성매매 종사자, 마약상 또는 도둑으로 묘사했습니다.​


벤치마크 테스트가 신뢰할 수 없고 오해의 소지가 있는 것으로 밝혀짐

옥스퍼드 연구팀은 445개 AI 벤치마크를 조사한 결과, 거의 모든 벤치마크에 기술 기업들이 주장하는 결과의 신뢰성을 "약화시키는 결함"이 있음을 발견했습니다. 벤치마크 중 통계적 테스트를 통해 신뢰성을 증명한 것은 16%에 불과했습니다.​

핵심적인 문제는 구성 타당성(construct validity), 즉 테스트가 실제로 그들이 측정한다고 주장하는 것을 제대로 측정하는지에 관한 것입니다. 옥스퍼드 인터넷 연구소의 수석 연구원인 아담 마디(Adam Mahdi)는 NBC 뉴스와의 인터뷰에서, 그레이드 스쿨 매스 8K(Grade School Math 8K) 벤치마크와 같은 테스트에서 모델이 좋은 성과를 거둔다고 해서 반드시 추론 능력을 보여준다고 할 수는 없다고 말했습니다. 그는 "1학년 학생에게 '2 더하기 5가 뭐야?'라고 물었을 때 '7이에요'라고 답하면, 분명 정답입니다. 하지만 이로부터 5학년이 수학적 추론을 완벽하게 습득했다고 결론지을 수 있을까요?"라고 덧붙였습니다.​

이번 연구는 데이터 오염(data contamination)을 주요 문제로 지적했는데, 이는 테스트 문항이 모델의 학습 데이터셋에 포함되어 있어 모델이 답을 추론하는 것이 아니라 암기해서 답을 내는 현상입니다. Mixtral, Phi-3, Gemma를 포함한 여러 모델은 GSM8K 벤치마크와 유사한 신규 문항으로 평가할 때 성능이 최대 13%까지 저하되는 것으로 나타났습니다.​

옥스퍼드 연구의 수석 저자인 앤드루 빈(Andrew Bean)은 업계에서 내놓는 주장들을 그대로 믿어서는 안 된다고 경고했습니다. "모델이 박사 수준의 지능을 가졌다는 것 같은 이야기를 볼 때는 한 번쯤 의심해볼 필요가 있습니다,"라고 빈은 NBC 뉴스에 말했습니다. 이번 연구 결과는 최근 구글이 자사의 Gemma AI 모델이 미국 상원의원에 관한 허위 주장을 생성한 후에 모델을 철회한 상황에서 나왔습니다.

댓글 0
전체 1,366 / 43 페이지
스크립트를 그대로 영상 으로 만들어 주는 기능이 유용한 앱이네요.
684 조회
0 추천
2025.12.05 등록
최태원 대한상공회의소 회장이 한국이 글로벌 인공지능(AI) 경쟁에서 살아남기 위해서는 7년 안에 1400조 원을 AI 인프라에 투자해야 한다고 강조했다. 최 회장은 5일 서울 중구 대한상의 국제회의장에서 열린 ‘제4회 한국은행-대한상의 공동 세미나’에서 이창용 한국은행 총재와의 특별대담을 통해 “한국의 잠재성장률이 5년 뒤면 마이너스로 내려갈 상황에 봉착해 있다”며 “AI를 활용한 새로운 성장 동력 확보가 시급하다”고 밝혔다.최 회장은 “AI 경쟁에 제대로 뛰어들려면 20기가와트(GW) 규모의 AI 데이터센터를 만들어야 한다”며 “1기가와트당 약 70조 원이 필요하므로 총 1400조 원 규모의 투자가 이뤄져야 한다”고 설명했다. 이는 2026년도 정부 예산(727조9000억 원)의 약 2배에 달하는 규모다. 그는 “이러한 국가 단위 프로젝트가 자리잡지 않는 이상 한 기업이 할 수 있는 상황이 아니다”고 덧붙였다.민간 주도 AI 발전 역설최 회장은 AI 발전이 국가가 아닌 민간 주도로 이뤄져야 한다고 강조했다. 그는 “AI 경쟁은 월드컵 같은 국가대항전이 아니다”며 “글로벌 경쟁 속에서 민간이 주도권을 놓치지 않도록 국가가 자원을 지원하는 것이 중요하다”고 말했다. 그는 “휴머노이드 로봇 하나 제작하는 데 우리가 1년 걸리는 것을 중국 상하이에선 6개월 안에 해낸다”며 “미국과 중국에 이어 3위라고 하지만 큰 차이가 나는 3위는 의미가 없다”고 지적했다.최 회장은 매력적인 AI 스타트업 육성이 핵심이라고 강조했다. 그는 “수만 개의 AI 스타트업을 만들어내지 못하면 현재 기업만으로 AI 전쟁을 치러내기 어렵다”며 “해외 자본을 끌어오려면 매력적인 회사들이 다수 나와야 한다”고 말했다.AI 버블론에 대한 견해최근 제기되는 AI 버블 논란에 대해 최 회장은 산업 분야와 주식시장을 구분해 답했다. 그는 “산업을 보면 버블이 아니지만 주식시장은 항상 오버슈팅이 있다”며 “전 세계의 돈이 너무 많이 풀린 상황에서 투기심리가 작동해 어느 정도 오버슈팅이 있을 수 있다”고 진단했다. 이에 대해 이 총재는 “주식시장이 그러지 않았으면 한다”며 우려를 표했다.이날 대담에서는 스테이블코인 도입에 관한 논의도 이뤄졌다. 이 총재는 “한국은행도 스테이블코인이 들어와야 한다는 입장”이라면서도 “은행을 중심으로 먼저 도입해야 한다”고 밝혔다.
679 조회
0 추천
2025.12.05 등록
이재명 대통령은 5일 서울 용산 대통령실에서 손정의 소프트뱅크그룹 회장을 만나 한일 간 인공지능(AI) 협력의 중요성을 강조하며, 손 회장에게 양국 협력의 가교 역할을 해 줄 것을 요청했습니다. 이 대통령은 손 회장이 과거 김대중, 문재인 대통령 시절에도 한국 경제 발전에 큰 도움을 주었음을 언급하며 감사를 표했고, 한국이 AI 분야에서 세계 3대 강국을 지향하고 있음을 밝혔습니다. 또한, 이 대통령은 AI 역량을 모든 국민과 국가가 함께 누리는 '인공지능 기본사회' 개념으로 활용하여 모든 국민과 기업이 AI를 활용하는 사회를 만들고자 하는 정부의 목표를 설명했습니다.이에 대해 손정의 회장은 과거 브로드밴드와 인공지능을 강조했던 것에 이어, 현재는 **'초인공지능(ASI, Artificial Super Intelligence)'**이 다음으로 임박한 핵심 기술이라고 역설했습니다. 손 회장이 정의하는 초인공지능은 인간 두뇌보다 1만 배 뛰어난 두뇌를 의미하며, 인류가 범용 인공지능(AGI)이 아닌 초인공지능의 등장 시점을 고민해야 한다고 주장했습니다. 그는 이제 인류가 AI를 통제하려 하기보다, 새로운 사고방식을 통해 AI와 조화롭게 함께 살아가는 방법을 모색해야 할 때라고 강조하며, 초인공지능이 친절하고 사람들을 행복하게 해 줄 것이므로 인류를 위협할 것을 걱정할 필요는 없다고 덧붙였습니다.대통령과 손 회장의 대화에서는 AI 버블 논란, 초인공지능의 문학상 석권 가능성 등 다양한 주제가 오갔으며, 이 대통령은 AI가 과학 분야에서 노벨상을 받는 상황뿐 아니라 노벨문학상까지 석권할 수 있을지에 대해 질문하기도 했습니다. 손 회장은 그럴 수 있을 것이라고 답하며 미래 AI 기술에 대한 강한 확신을 드러냈습니다. 한편, 이 대통령은 면담 말미에 손 회장이 구단주로 있는 일본 프로야구팀 '소프트뱅크 호크스'의 우승을 언급하며 축하 인사를 건네는 등 우호적인 분위기 속에서 회담을 마무리했습니다.
693 조회
0 추천
2025.12.05 등록
• 연구자들과 칩 제조업체들은 뇌의 신경 구조를 모방하는 뉴로모픽 프로세서의 상용화를 위해 경쟁하고 있으며, 이는 데이터 센터의 예상 소비량이 2024년 415테라와트시에서 2030년까지 945TWh로 증가함에 따라 기존 칩 대비 100배에서 1,000배의 에너지 효율성 향상을 약속하고 있습니다.• Intel과 IBM은 에너지 집약적인 데이터 전송을 제거하기 위해 메모리와 프로세싱을 통합한 Loihi 2 및 NorthPole과 같은 프로토타입 칩을 선보였으며, NorthPole은 이미지 인식 작업에서 NVIDIA의 V100 GPU보다 25배 더 에너지 효율적임이 입증되었습니다.• 12월 4일, 네덜란드 기반의 Innatera는 뉴로모픽 컴퓨팅 시장이 2025년 48억 9천만 달러에서 2035년까지 761억 8천만 달러로 성장할 것으로 예상됨에 따라, 1밀리와트 미만의 Pulsar 칩을 상용 제품에 배포하는 것을 가속화하기 위해 영국 컨설팅 회사 42 Technology와의 파트너십을 발표했습니다.
675 조회
0 추천
2025.12.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입