Loading...

AI 뉴스

연구들이 AI 훈련 데이터와 테스트의 결함을 드러내다

페이지 정보

작성자 xtalfi
작성일 2025.11.07 14:52
1,065 조회
0 추천
0 비추천

본문

251105-ai-safety-tests-lr-10661e.jpg

(퍼플렉시티가 정리한 기사)


이번 주에 발표된 두 가지 주요 연구는 인공지능 시스템이 구축되고 평가되는 방식의 심각한 약점을 드러내며, AI 능력이 과장되어 왔는지에 대한 의문을 제기하고 있다.

Sony AI는 11월 5일 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 데이터셋인 Fair Human-Centric Image Benchmark를 공개했으며, 옥스퍼드 인터넷 연구소와 영국 정부의 AI 보안 연구소 연구원들은 AI 성능을 측정하는 데 사용되는 테스트의 광범위한 결함을 밝히는 연구를 발표했다. 이러한 연구 결과들은 많은 AI 시스템이 윤리적으로 문제가 있는 데이터로 훈련되고 신뢰할 수 없는 방법으로 평가될 수 있음을 시사한다.​


훈련 데이터에 동의와 다양성이 부족함

Sony AI가 Nature에 발표한 새로운 벤치마크는 연구자들이 컴퓨터 비전 시스템에서 "편향되고 윤리적으로 문제가 있는 학습 데이터의 지속적인 과제"라고 부르는 문제를 다룹니다. 이 데이터셋은 81개국 1,981명의 개인이 찍힌 10,318장의 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받아 수집되었습니다—이는 업계 관행과 크게 다른 방식입니다.​

Sony Group의 AI 거버넌스 글로벌 책임자인 Alice Xiang은 컴퓨터 비전이 객관적이지 않다고 강조했습니다. "컴퓨터 비전은 학습 데이터에 반영된 편향에 따라 사물을 왜곡할 수 있습니다"라고 그녀는 말했습니다. 데이터셋은 기존 AI 모델 중 공정성 테스트를 완전히 통과한 모델이 없다는 것을 보여주었습니다. 일부 모델은 "she/her/hers" 대명사를 사용하는 사람들에 대해 낮은 정확도를 보였으며, 벤치마크는 이를 더 큰 헤어스타일 변동성—이전에 간과되었던 요인—으로 추적했습니다. 직업에 대한 중립적인 질문을 받았을 때, 테스트된 모델들은 특정 인구통계학적 그룹에 대해 특히 고정관념을 강화했으며, 때로는 피사체를 성매매 종사자, 마약상 또는 도둑으로 묘사했습니다.​


벤치마크 테스트가 신뢰할 수 없고 오해의 소지가 있는 것으로 밝혀짐

옥스퍼드 연구팀은 445개 AI 벤치마크를 조사한 결과, 거의 모든 벤치마크에 기술 기업들이 주장하는 결과의 신뢰성을 "약화시키는 결함"이 있음을 발견했습니다. 벤치마크 중 통계적 테스트를 통해 신뢰성을 증명한 것은 16%에 불과했습니다.​

핵심적인 문제는 구성 타당성(construct validity), 즉 테스트가 실제로 그들이 측정한다고 주장하는 것을 제대로 측정하는지에 관한 것입니다. 옥스퍼드 인터넷 연구소의 수석 연구원인 아담 마디(Adam Mahdi)는 NBC 뉴스와의 인터뷰에서, 그레이드 스쿨 매스 8K(Grade School Math 8K) 벤치마크와 같은 테스트에서 모델이 좋은 성과를 거둔다고 해서 반드시 추론 능력을 보여준다고 할 수는 없다고 말했습니다. 그는 "1학년 학생에게 '2 더하기 5가 뭐야?'라고 물었을 때 '7이에요'라고 답하면, 분명 정답입니다. 하지만 이로부터 5학년이 수학적 추론을 완벽하게 습득했다고 결론지을 수 있을까요?"라고 덧붙였습니다.​

이번 연구는 데이터 오염(data contamination)을 주요 문제로 지적했는데, 이는 테스트 문항이 모델의 학습 데이터셋에 포함되어 있어 모델이 답을 추론하는 것이 아니라 암기해서 답을 내는 현상입니다. Mixtral, Phi-3, Gemma를 포함한 여러 모델은 GSM8K 벤치마크와 유사한 신규 문항으로 평가할 때 성능이 최대 13%까지 저하되는 것으로 나타났습니다.​

옥스퍼드 연구의 수석 저자인 앤드루 빈(Andrew Bean)은 업계에서 내놓는 주장들을 그대로 믿어서는 안 된다고 경고했습니다. "모델이 박사 수준의 지능을 가졌다는 것 같은 이야기를 볼 때는 한 번쯤 의심해볼 필요가 있습니다,"라고 빈은 NBC 뉴스에 말했습니다. 이번 연구 결과는 최근 구글이 자사의 Gemma AI 모델이 미국 상원의원에 관한 허위 주장을 생성한 후에 모델을 철회한 상황에서 나왔습니다.

댓글 0
전체 1,366 / 144 페이지
(퍼플렉시티가 정리한 기사)자율주행 차량용 라이다 기술을 개척한 David S. Hall은 월요일, 고속 공중 위협을 정밀하게 추적하도록 설계된 첨단 탐지 시스템인 Cam-Lidar의 출시를 발표했다. 이 기술은 Hall이 항공우주 보안 솔루션 개발을 위해 올해 초 설립한 몬태나 기반 회사인 Hall Lidar Inc.의 첫 번째 제품이다.Hall은 성명을 통해 “이것은 자율주행용 라이다 발명보다 더 중요할 것”이라고 말했다. “Cam-Lidar는 미국 안보와 급성장하는 드론 방어 분야에서의 글로벌 경쟁을 위해 시급히 필요한 최첨단 기술입니다.”이번 발표는 유럽 전역에서 드론 침입이 공항과 주요 기반시설을 혼란에 빠뜨리고 있는 가운데 나왔다. 벨기에는 최근 며칠간 브뤼셀 공항과 Doel 원자력 발전소 상공에서 반복적인 무단 드론 비행에 직면하여 긴급 안보 회의를 소집했다.고급 탐지 기능Cam-Lidar는 라이다 센서, 고성능 카메라, 인공지능을 통합하여 최대 2킬로미터 거리에서 공중 물체를 감지하고 추적합니다. 이 시스템은 라이다와 카메라 피드를 초당 60프레임으로 동기화하여 실시간 3D 공간 시각화를 가능하게 합니다.Hall Lidar Inc.에 따르면, 이 기술은 노트북만큼 작은 물체를 식별할 수 있으며, 음속인 마하 1에 근접하는 속도로 이동하는 목표물을 반복 가능한 정확도로 추적할 수 있습니다. 이 시스템은 악천후 조건에서 작고 빠르게 움직이는 드론을 감지하는 데 어려움을 겪는 기존 레이더 및 광학 탐지 방법의 한계를 해결합니다.이 기술은 쌍안경과 같은 유닛으로 작동하며 Hall의 전자기 발사 시스템과 함께 작동하여 초당 최대 5회의 속도로 그물 기반 포획 도구를 배치합니다. 적용 분야로는 공항, 데이터 센터, 교정 시설, 군사 시설 및 국경 보호가 포함됩니다.증가하는 시장 수요안티드론 시장은 산업 분석에 따르면 2025년 26억 달러를 넘어설 것으로 예상되며, 2035년까지 강력한 성장이 기대됩니다. 드론 위협이 증가함에 따라 연방 기관들은 첨단 탐지 기술을 우선순위에 두고 있습니다.업계 전문가들은 센서 융합과 AI 기반 시스템을 대드론 방어의 결정적인 변화로 지목했습니다. 보안산업협회(Security Industry Association)의 드론 보안 소위원회 의장인 브렛 페더슨(Brett Feddersen)은 “가장 큰 게임 체인저는 대드론 시스템을 통합하고 AI를 활용하여 드론 위협을 안전하게 탐지하고 완화하는 시스템 오브 시스템(System-of-Systems) 접근 방식으로의 전환”이라고 말했습니다.홀은 2005년 DARPA 그랜드 챌린지를 위한 3D 라이다 시각화 기술을 개발한 후 2016년 벨로다인 라이다(Velodyne Lidar)를 설립했습니다. 그는 2025년 2월 몬태나주 보즈먼에 홀 라이다(Hall Lidar Inc.)를 설립했으며, 캘리포니아주 앨러미다에 운영 및 테스트 시설을 두고 있습니다
1070 조회
0 추천
2025.11.11 등록
(퍼플렉시티가 정리한 기사)구글의 스마트 스피커에 Gemini 음성 비서를 야심차게 출시하는 과정이 상당한 장애물에 부딪히고 있으며, 10월 28일 출시 2주 후 초기 사용자들이 기본적인 스마트 홈 기능과 명령어 연결 기능의 실패를 보고하고 있습니다.배포는 천천히 진행되고 있으며, 조기 접근을 신청했음에도 불구하고 대부분의 사용자들이 여전히 접근을 기다리고 있습니다. 11월 7일 발표된 Android Authority 설문조사에 따르면, 응답자의 89%가 자신의 기기에서 Gemini를 받지 못했습니다. 구글은 11월 10일 전면 출시가 2026년 1분기까지 도달하지 않을 수 있으며, 사용자 계정별이 아닌 가정별로 배포가 진행되고 있음을 확인했습니다.기본 기능 실패얼리 어댑터들은 기본적인 작업에서 광범위한 문제를 문서화했습니다. 사용자들은 Gemini가 조명, 잠금장치 및 기타 연결된 장치를 안정적으로 제어할 수 없다고 보고하고 있습니다. 이는 이전 Google Assistant 시스템에서 작동했던 핵심 기능입니다. Reddit 사용자 y_u_no_knock는 10월 30일 브로드캐스트 기능이 완전히 작동을 멈췄으며, Gemini가 장치들이 “메시지를 보낼 수 없다”고 주장한다고 작성했습니다.Google이 눈에 띄게 광고했던 기능인 여러 명령을 함께 연결하는 기능은 많은 사용자들에게 작동하지 않는 것으로 보입니다. 회사는 “조명을 켜고, TV를 켜고, 현관문을 잠그고, 온도를 올려줘”와 같은 요청이 원활하게 작동할 것이라고 약속했습니다. 그러나 Reddit과 Google 지원 포럼의 여러 사용자들은 이제 명령을 결합하면 오류 메시지가 발생한다고 보고하고 있습니다.AI 통합의 기술적 과제이러한 어려움은 생성형 AI와 전통적인 스마트 홈 아키텍처 간의 근본적인 비호환성에서 비롯됩니다. “LLM은 창의성에는 뛰어나지만, 예측 가능한 결과로 동일한 작업을 일관되게 반복하는 데는 어려움을 겪습니다”라고 Google Home 및 Nest의 최고 제품 책임자인 Anish Kattukaran이 The Verge에 말했습니다.기존 음성 비서는 특정 문구가 미리 정해진 동작을 실행하는 명령 및 제어 프레임워크로 작동했습니다. 대규모 언어 모델은 요청을 더 대화식으로 처리하지만 예측 불가능성을 초래합니다. Amazon도 Alexa Plus 업그레이드에서 유사한 장애물에 직면했으며, 두 회사 모두 AI 기능을 안정적인 기기 제어와 통합하는 데 어려움을 겪고 있습니다.Google은 7월에 Kattukaran이 Assistant 성능 문제에 대해 사과하고 가을까지 “대대적인 개선”을 약속하면서 스마트 홈 신뢰성 문제를 인정했습니다. 회사는 예정대로 Gemini를 출시했지만 AI 기반 홈 제어 시스템을 괴롭히는 근본적인 기술적 과제는 해결하지 못했습니다.
1082 조회
0 추천
2025.11.11 등록
(퍼플렉시티가 정리한 기사)카카오는 11일 국내 인공지능(AI) 분야를 대표하는 업계 및 학계 전문가 13명과 함께 ‘카카오 일상AI 포럼’을 발족했다고 밝혔다. 이 포럼은 AI 기술과 서비스의 최신 동향을 비롯해 각 영역의 현안과 쟁점에 대해 정기적인 발표와 토론을 통해 실행 방안과 해결책을 모색하는 것을 목표로 한다.카카오는 10일 첫 회차 포럼을 개최하며 ’Agentic AI(에이전틱 AI)’를 주제로 세션 발표 및 토론을 진행했다. 노정석 비팩토리 대표가 ‘AI 시대 개별 비즈니스들의 진화 방향’을, 심규현 렛서 대표가 ‘에이전틱 AI로 바뀌는 조직 구조’를 발표했으며, 김세웅 카카오 성과리더는 ‘에이전틱 AI 전환, 플랫폼 전략의 새로운 시작’을 주제로 강연했다.다양한 분야 전문가 참여포럼에는 김덕진 IT커뮤니케이션연구소장, 김도균 달파 대표, 김승일 모두의연구소 대표, 김종윤 스캐터랩 대표, 유수연 네이션에이 대표, 엄윤설 에이로봇 대표, 장동선 미래탐험공동체 대표, 정지훈 Asia2G캐피탈 제너럴 파트너, 최재식 인이지 대표 등 11명의 외부 전문가가 참여한다. 카카오에서는 김병학 카나나 성과리더와 김세웅 AI시너지 성과리더가 함께하며 카카오의 AI 기술 및 서비스와의 연결고리를 강화한다.스타트업, 학계, 산업계 등 다양한 영역의 전문가들이 참여하는 만큼 현장 경험을 바탕으로 한 실질적이고 대안 중심의 토론이 이어질 것으로 기대된다. 포럼에서는 AI가 대중의 일상에 미치는 영향과 산업 구조의 변화, 그 과정에서 해결해야 할 현실적 과제들에 대해 심도 있는 논의를 진행할 예정이다.AI 대중화와 산업 혁신 지향포럼 참석자들은 “AI가 바꿀 일상과 산업 생태계에 대해 진지하고 실질적인 토론을 진행할 수 있어 뜻깊었다”며 “대중의 삶에 AI가 빠르고 긍정적인 방향으로 자리잡을 수 있는 길을 함께 찾아갔으면 한다”고 밝혔다.카카오 관계자는 “포럼을 통해 현장의 다양한 실사례에 기반한 경험과 인사이트를 공유하고자 한다”며 “AI 각 영역 전문가들이 포진한 만큼 우리 사회 및 산업계가 지향해야 할 AI 혁신의 방향성과 구체적 실행 방안을 함께 모색해갈 것”이라고 말했다.
1094 조회
0 추천
2025.11.11 등록
(퍼플렉시티가 정리한 기사)최태원 SK그룹 회장이 오는 21일 일본을 방문해 인공지능(AI)과 반도체를 중심으로 한 한일 경제 협력 방안을 제시한다. 최 회장은 도쿄대 야스다 강당에서 열리는 ‘도쿄포럼 2025’ 개회사를 통해 자본주의가 직면한 불평등과 지속가능성, 기술 전환 등의 문제를 짚고 ‘연대’를 중심으로 한 새로운 경제 패러다임을 제시할 것으로 예상된다.EU식 경제공동체 강조최 회장은 수년 전부터 유럽연합(EU)과 같은 경제공동체 방식의 한일 협력을 주장해왔다. 그는 한일 양국이 경제 공동체를 형성해 다양한 비용을 줄이고 기업들이 첨단 분야에서 기술 경쟁력을 함께 높일 수 있다는 견해를 밝혀왔다. 올해는 한일 국교 정상화 60주년이라는 점에서 이번 포럼이 더욱 의미가 있다.이번 포럼의 소주제는 ‘다양성, 모순, 그리고 미래’로, 최 회장은 인공지능 등을 통해 자본주의의 모순을 넘어서는 실천적 해법을 강조할 전망이다. 최 회장은 같은 날 후지이 데루오 도쿄대 총장, 이와이 무쓰오 일본 기업경영자협회 수석부회장과 비즈니스 리더 세션에도 참여하며, 박철희 일본 국제교류회 특별 고문이 좌장을 맡는다.AI·반도체 협력 구체화최 회장은 한일 경제 연대 가능성이 큰 분야로 AI와 반도체를 제시한 바 있다. SK는 일본 NTT 와 반도체 기술 개발에 대한 논의를 진행하고 있으며, 전기가 아닌 빛 형태로 통신 데이터를 전달하는 ‘아이온(IOWN)’ 프로젝트에 참여해 새로운 반도체 개발을 진행 중이다. 일부 외신에 따르면 NTT는 지난해 초 일본 정부로부터 아이온 프로젝트에 450억엔을 지원받으며 SK하이닉스, 인텔 등이 반도체 개발에 참여하고 있다.도쿄포럼은 최종현학술원과 도쿄대가 2019년부터 매년 공동 개최하는 국제 포럼으로, 22일까지 이틀간 진행된다. 최 회장은 지난해 도쿄포럼에서 “디자인 사고의 도움으로 사업을 성공적으로 관리하고 시너지를 창출해왔다”고 밝힌 바 있다.
1075 조회
0 추천
2025.11.11 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입