Loading...

AI 뉴스

연구들이 AI 훈련 데이터와 테스트의 결함을 드러내다

페이지 정보

작성자 xtalfi
작성일 2025.11.07 14:52
1,036 조회
0 추천
0 비추천

본문

251105-ai-safety-tests-lr-10661e.jpg

(퍼플렉시티가 정리한 기사)


이번 주에 발표된 두 가지 주요 연구는 인공지능 시스템이 구축되고 평가되는 방식의 심각한 약점을 드러내며, AI 능력이 과장되어 왔는지에 대한 의문을 제기하고 있다.

Sony AI는 11월 5일 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 데이터셋인 Fair Human-Centric Image Benchmark를 공개했으며, 옥스퍼드 인터넷 연구소와 영국 정부의 AI 보안 연구소 연구원들은 AI 성능을 측정하는 데 사용되는 테스트의 광범위한 결함을 밝히는 연구를 발표했다. 이러한 연구 결과들은 많은 AI 시스템이 윤리적으로 문제가 있는 데이터로 훈련되고 신뢰할 수 없는 방법으로 평가될 수 있음을 시사한다.​


훈련 데이터에 동의와 다양성이 부족함

Sony AI가 Nature에 발표한 새로운 벤치마크는 연구자들이 컴퓨터 비전 시스템에서 "편향되고 윤리적으로 문제가 있는 학습 데이터의 지속적인 과제"라고 부르는 문제를 다룹니다. 이 데이터셋은 81개국 1,981명의 개인이 찍힌 10,318장의 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받아 수집되었습니다—이는 업계 관행과 크게 다른 방식입니다.​

Sony Group의 AI 거버넌스 글로벌 책임자인 Alice Xiang은 컴퓨터 비전이 객관적이지 않다고 강조했습니다. "컴퓨터 비전은 학습 데이터에 반영된 편향에 따라 사물을 왜곡할 수 있습니다"라고 그녀는 말했습니다. 데이터셋은 기존 AI 모델 중 공정성 테스트를 완전히 통과한 모델이 없다는 것을 보여주었습니다. 일부 모델은 "she/her/hers" 대명사를 사용하는 사람들에 대해 낮은 정확도를 보였으며, 벤치마크는 이를 더 큰 헤어스타일 변동성—이전에 간과되었던 요인—으로 추적했습니다. 직업에 대한 중립적인 질문을 받았을 때, 테스트된 모델들은 특정 인구통계학적 그룹에 대해 특히 고정관념을 강화했으며, 때로는 피사체를 성매매 종사자, 마약상 또는 도둑으로 묘사했습니다.​


벤치마크 테스트가 신뢰할 수 없고 오해의 소지가 있는 것으로 밝혀짐

옥스퍼드 연구팀은 445개 AI 벤치마크를 조사한 결과, 거의 모든 벤치마크에 기술 기업들이 주장하는 결과의 신뢰성을 "약화시키는 결함"이 있음을 발견했습니다. 벤치마크 중 통계적 테스트를 통해 신뢰성을 증명한 것은 16%에 불과했습니다.​

핵심적인 문제는 구성 타당성(construct validity), 즉 테스트가 실제로 그들이 측정한다고 주장하는 것을 제대로 측정하는지에 관한 것입니다. 옥스퍼드 인터넷 연구소의 수석 연구원인 아담 마디(Adam Mahdi)는 NBC 뉴스와의 인터뷰에서, 그레이드 스쿨 매스 8K(Grade School Math 8K) 벤치마크와 같은 테스트에서 모델이 좋은 성과를 거둔다고 해서 반드시 추론 능력을 보여준다고 할 수는 없다고 말했습니다. 그는 "1학년 학생에게 '2 더하기 5가 뭐야?'라고 물었을 때 '7이에요'라고 답하면, 분명 정답입니다. 하지만 이로부터 5학년이 수학적 추론을 완벽하게 습득했다고 결론지을 수 있을까요?"라고 덧붙였습니다.​

이번 연구는 데이터 오염(data contamination)을 주요 문제로 지적했는데, 이는 테스트 문항이 모델의 학습 데이터셋에 포함되어 있어 모델이 답을 추론하는 것이 아니라 암기해서 답을 내는 현상입니다. Mixtral, Phi-3, Gemma를 포함한 여러 모델은 GSM8K 벤치마크와 유사한 신규 문항으로 평가할 때 성능이 최대 13%까지 저하되는 것으로 나타났습니다.​

옥스퍼드 연구의 수석 저자인 앤드루 빈(Andrew Bean)은 업계에서 내놓는 주장들을 그대로 믿어서는 안 된다고 경고했습니다. "모델이 박사 수준의 지능을 가졌다는 것 같은 이야기를 볼 때는 한 번쯤 의심해볼 필요가 있습니다,"라고 빈은 NBC 뉴스에 말했습니다. 이번 연구 결과는 최근 구글이 자사의 Gemma AI 모델이 미국 상원의원에 관한 허위 주장을 생성한 후에 모델을 철회한 상황에서 나왔습니다.

댓글 0
전체 1,366 / 150 페이지
(퍼플렉시티가정리한기사)JPMorganChaseCEO제이미다이먼은목요일인공지능이향후몇십년내에주당근무시간을3.5일로단축할수있을것이라고전망하면서,기업들이전환에따른일자리대체에대비해야한다고경고했다.11월6일마이애미에서열린AmericaBusinessForum에서다이먼은참석자들에게AI가"모든애플리케이션,모든직업,모든고객인터페이스에영향을미칠것"이라고Fortune에따르면말했다."제생각에는선진국은20년,30년,40년후에는주당3.5일근무하면서멋진삶을살게될것입니다"라고그는말했다.​JPMorgan의AI투자가성과를거두다Dimon의예측은Fortune지가"실전AI연구소"라고묘사한JPMorgan에서의직접적인경험에서비롯되었다.이은행은현재약2,000명의직원을고용하여AI시스템을개발하고있으며,약150,000명의직원이내부업무를위해매주대규모언어모델을사용하고있다.이시스템들은사기탐지부터법률검토,대사작업,마케팅최적화에이르기까지다양한업무를처리한다.​10월Bloomberg와의인터뷰에서Dimon은은행이AI개발에연간약20억달러를지출하며거의같은금액의비용절감을달성한다고밝혔다."20억달러의비용으로약20억달러의이익을얻었다는것을보여주었습니다"라고그는말하며"이것은빙산의일각입니다"라고덧붙였다.​일자리대체에대한경고그의낙관적인장기전망에도불구하고,다이먼은앞으로다가올고통스러운전환기를인정했다."일자리를없앨것입니다.사람들은현실을외면하는것을멈춰야합니다"라고그는포춘가장영향력있는여성컨퍼런스에서경고했다.그는기업과정부가재교육,소득지원,재배치,그리고경우에따라서는조기은퇴에투자하여사회적불안을예방함으로써인력변화에대비할것을촉구했다.​다이먼은AI의경제성이인터넷시대와다르다는점을강조하며,이기술이자본집약적이면서동시에전력집약적이라고언급했다.일부과대평가된프로젝트들은"필요한전력을얻지못할것"이라고그는말하며,투자자들에게테마전체를무분별하게매수하기보다는각AI인프라프로젝트를개별적으로평가할것을조언했다.​그의예측은다른기술리더들의유사한전망과일치한다.공동창립자빌게이츠는2023년에AI가"결국주3일만일하면되는사회를만들수있다"고제안했다.CEO에릭위안은9월뉴욕타임즈와의인터뷰에서AI가생산성을향상시킴에따라"모든회사가주3일,4일근무를지원할것"이라고말했다.
1087 조회
0 추천
2025.11.10 등록
(퍼플렉시티가 정리한 기사)챗GPT를 개발한 오픈AI가 지난달 27일 백악관에 서한을 보내 반도체 관련 세액공제 혜택을 AI 데이터센터 등 인프라 전반으로 확대해달라고 공식 요청했다. 크리스 리헤인 오픈AI 최고대외협력책임자 명의로 마이클 크라치오스 백악관 과학기술정책실장에게 전달된 이 서한은 7일(현지시간) 오픈AI 홈페이지를 통해 공개됐다.오픈AI는 2022년 제정된 반도체법(칩스법)에 따른 35% 투자세액공제 대상을 기존 반도체 제조뿐 아니라 AI 데이터센터 건설, AI 서버 제조업체, 변압기와 전기강판 등 전력망 구성품까지 확대해야 한다고 주장했다. 리헤인은 서한에서 “세액공제 대상 확대는 실질적 자본 비용을 낮추고 초기 투자 위험을 완화하며 민간 자본을 유치해 병목 현상을 해소하고 미국 내 AI 구축을 가속할 것”이라고 강조했다.5000억 달러 규모 데이터센터 계획오픈AI는 향후 수년 내 최대 5000억 달러(약 729조원) 규모의 AI 데이터센터를 미국 내에 건설할 계획이라고 밝힌 상태다. 회사는 향후 8년간 총 1조4000억 달러 규모의 컴퓨팅 자원 구축에 투자하겠다고 약속한 바 있다. 이번 제안이 수용될 경우 오픈AI는 해당 정책의 최대 수혜자 중 하나가 될 것으로 전망된다.[newsis +2]오픈AI는 또한 정부가 중국에 맞서 미국 내 제조업체에 보조금 지급, 비용 분담 협정, 대출 또는 대출 보증 등을 제공해야 한다고 주장했다. 회사는 이러한 재정 지원이 구리, 알루미늄, 전기강판, 희토류 원소, 반도체 원자재 등에 대한 중국의 ‘시장 왜곡’에 대응하는 데 도움이 될 것이라고 밝혔다.‘구제금융 논란’ 속 요청이번 요청은 오픈AI가 정부 지원을 둘러싼 논란에 휩싸인 직후 나왔다. 새러 프라이어 오픈AI 최고재무책임자(CFO)는 지난주 한 콘퍼런스에서 정부가 AI 인프라 투자에 대한 ’백스톱(안전망)’을 제공할 수 있다고 언급했다가 역풍을 맞았다. 도널드 트럼프 행정부의 AI 정책을 총괄하는 데이비드 색스 백악관 과학기술자문위원장은 “AI에 대한 연방정부의 구제금융은 없다”고 선을 그었다.샘 올트먼 오픈AI 최고경영자(CEO)는 7일 소셜미디어를 통해 세액공제 확대 요청을 재확인하면서도 “세액공제는 오픈AI에 대한 대출 보증과는 완전히 다른 것”이라고 강조했다.
1121 조회
0 추천
2025.11.08 등록
(퍼플렉시티가 정리한 기사)구글은 목요일에 디지털 출판사를 위한 인공지능(AI) 기반 도구 모음을 공개했습니다. 광고 리뷰에서 성과 보고에 이르기까지 노동 집약적인 작업을 자동화함으로써, 구글은 라이브 스트리밍 수익화에 대한 증가하는 수요를 잡기 위해 자사의 입지를 다지고 있습니다.Ad Manager, AdSense, AdMob의 업데이트는 세 가지 AI 자동화 기능을 도입합니다. 첫 번째는 각 출판사의 개별 선호도를 학습하여 결국 원하지 않는 광고를 자동으로 차단할 브랜드 안전 시스템, 두 번째는 자연어 질의에서 맞춤형 성과 보고서를 생성하는 생성형 AI 보고 도구, 그리고 문제 해결 및 온보딩 지원을 위한 AI 기반 채팅 어시스턴트입니다.라이브 콘텐츠 수익화 타겟팅이 거대 기술 기업은 또한 새로운 CTV Live-biddable 솔루션을 통해 라이브 콘텐츠에 투자하고 있으며, 이는 퍼블리셔들이 스포츠 연장전이나 예정보다 길어진 시상식과 같이 예측 불가능한 높은 시청률 순간을 수익화할 수 있도록 지원합니다. 이러한 움직임은 보스턴 컨설팅 그룹과 구글의 10월 연구에 따르면, 구매자의 82%가 향후 12개월 동안 프로그래매틱 라이브 커넥티드 TV 투자를 늘릴 계획이라고 밝힌 가운데 나온 것입니다.DAZN의 미디어 운영 담당 수석 부사장인 로넌 매카시는 회사 발표에서 “Google Ad Manager의 라이브 CTV 솔루션을 통해 FIFA 클럽 월드컵을 전 세계 수백만 팬들에게 고품질 스트림으로 제공할 수 있었습니다”라고 말했습니다.구글의 글로벌 파트너십 및 판매측 수익화 담당 부사장인 스콧 셰퍼는 수요일 블로그 게시물에서 이러한 업데이트를 발표했습니다. AI 브랜드 안전 도구는 퍼블리셔가 광고 검토 센터에서 내린 결정을 분석하여 기본 카테고리 제한을 넘어선 선호도를 파악하며, 현재는 잠재적으로 원치 않는 광고를 표시하고 궁극적으로는 수동 개입 없이 이를 차단합니다.직접 거래 간소화Google은 또한 기존의 직접 거래 통제와 프로그래매틱 효율성을 결합한 기능인 Buyer Direct를 도입했으며, 이는 퍼블리셔 간 노출 빈도 관리, 실시간 리포팅 및 통합 청구 기능을 제공합니다. Google은 이번 업데이트가 퍼블리셔들을 수작업에서 해방시켜 콘텐츠 제작에 집중할 수 있도록 하는 동시에 새로운 수익원을 개척하는 것을 목표로 한다고 밝혔습니다.
1109 조회
0 추천
2025.11.08 등록
(퍼플렉시티가 정리한 기사)메타 플랫폼스는 금요일, 회사가 “초지능”이라고 부르는 것을 달성하기 위한 경쟁의 일환으로 인공지능 데이터 센터 구축에 초점을 맞춰 향후 3년간 미국 인프라와 일자리에 6,000억 달러를 투자할 것이라고 발표했습니다.CEO 마크 저커버그가 9월 백악관 만찬에서 도널드 트럼프 대통령에게 처음 공개한 이 대규모 투자 계획은 미국 역사상 가장 큰 기업 인프라 투자 중 하나를 나타냅니다. 이 투자는 2028년까지 AI 기술, 인프라 개발 및 인력 확충을 지원할 것입니다.투자자 우려 속 공격적 확장이번 발표는 메타가 AI 지출에 대한 증가하는 감시에 직면하면서 나왔다. 회사의 주가는 지난주 3분기 실적 보고서 발표 후 16% 이상 급락하여 약 3,070억 달러의 시가총액이 증발했으며, 투자자들은 회사의 증가하는 자본 지출에 대한 투자 수익률에 의문을 제기했다. 메타는 2025년 자본 지출 가이던스를 700억 달러에서 720억 달러 사이로 상향 조정했으며, 2026년에는 “현저히 더 큰” 지출을 예상하고 있다.시장의 혼란에도 불구하고, 월스트리트 애널리스트들은 비교적 확고한 목표 주가를 유지했으며, 컨센서스 전망은 30% 이상의 상승 잠재력을 시사했다. 회사는 실적 발표에서 자사의 전략을 옹호했으며, 저커버그는 “가장 낙관적인 경우에 대비할 수 있도록 공격적으로 용량을 선제적으로 확보하는 것이 올바른 전략”이라고 말했다.주요 프로젝트 및 자금 조달Meta는 최근 루이지애나주 하이페리온 데이터 센터 건설 자금 조달을 위해 Blue Owl Capital과 기록적인 270억 달러 규모의 금융 거래를 체결했으며, 이는 전 세계적으로 가장 큰 프로젝트입니다. 400만 평방피트 이상의 면적에 최대 5기가와트의 전력을 사용할 것으로 예상되는 이 시설은 2030년까지 완공될 예정입니다. 계약에 따라 Blue Owl은 80%의 지분을 보유하고 Meta는 20%의 소유권과 운영 통제권을 유지합니다.10월에 Meta는 텍사스주 엘패소에 15억 달러를 투자하여 데이터 센터를 건설할 계획을 발표했으며, 이는 전 세계적으로 29번째 시설이자 텍사스주에서는 세 번째 시설입니다. 120만 평방피트 규모의 캠퍼스는 1기가와트까지 확장 가능하며, 건설 인력 1,800명과 정규직 운영 인력 100명을 포함하여 거의 2,000개의 일자리를 창출할 것으로 예상됩니다.
1114 조회
0 추천
2025.11.08 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입