Loading...

AI 뉴스

연구들이 AI 훈련 데이터와 테스트의 결함을 드러내다

페이지 정보

작성자 xtalfi
작성일 2025.11.07 14:52
1,130 조회
0 추천
0 비추천

본문

251105-ai-safety-tests-lr-10661e.jpg

(퍼플렉시티가 정리한 기사)


이번 주에 발표된 두 가지 주요 연구는 인공지능 시스템이 구축되고 평가되는 방식의 심각한 약점을 드러내며, AI 능력이 과장되어 왔는지에 대한 의문을 제기하고 있다.

Sony AI는 11월 5일 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 데이터셋인 Fair Human-Centric Image Benchmark를 공개했으며, 옥스퍼드 인터넷 연구소와 영국 정부의 AI 보안 연구소 연구원들은 AI 성능을 측정하는 데 사용되는 테스트의 광범위한 결함을 밝히는 연구를 발표했다. 이러한 연구 결과들은 많은 AI 시스템이 윤리적으로 문제가 있는 데이터로 훈련되고 신뢰할 수 없는 방법으로 평가될 수 있음을 시사한다.​


훈련 데이터에 동의와 다양성이 부족함

Sony AI가 Nature에 발표한 새로운 벤치마크는 연구자들이 컴퓨터 비전 시스템에서 "편향되고 윤리적으로 문제가 있는 학습 데이터의 지속적인 과제"라고 부르는 문제를 다룹니다. 이 데이터셋은 81개국 1,981명의 개인이 찍힌 10,318장의 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받아 수집되었습니다—이는 업계 관행과 크게 다른 방식입니다.​

Sony Group의 AI 거버넌스 글로벌 책임자인 Alice Xiang은 컴퓨터 비전이 객관적이지 않다고 강조했습니다. "컴퓨터 비전은 학습 데이터에 반영된 편향에 따라 사물을 왜곡할 수 있습니다"라고 그녀는 말했습니다. 데이터셋은 기존 AI 모델 중 공정성 테스트를 완전히 통과한 모델이 없다는 것을 보여주었습니다. 일부 모델은 "she/her/hers" 대명사를 사용하는 사람들에 대해 낮은 정확도를 보였으며, 벤치마크는 이를 더 큰 헤어스타일 변동성—이전에 간과되었던 요인—으로 추적했습니다. 직업에 대한 중립적인 질문을 받았을 때, 테스트된 모델들은 특정 인구통계학적 그룹에 대해 특히 고정관념을 강화했으며, 때로는 피사체를 성매매 종사자, 마약상 또는 도둑으로 묘사했습니다.​


벤치마크 테스트가 신뢰할 수 없고 오해의 소지가 있는 것으로 밝혀짐

옥스퍼드 연구팀은 445개 AI 벤치마크를 조사한 결과, 거의 모든 벤치마크에 기술 기업들이 주장하는 결과의 신뢰성을 "약화시키는 결함"이 있음을 발견했습니다. 벤치마크 중 통계적 테스트를 통해 신뢰성을 증명한 것은 16%에 불과했습니다.​

핵심적인 문제는 구성 타당성(construct validity), 즉 테스트가 실제로 그들이 측정한다고 주장하는 것을 제대로 측정하는지에 관한 것입니다. 옥스퍼드 인터넷 연구소의 수석 연구원인 아담 마디(Adam Mahdi)는 NBC 뉴스와의 인터뷰에서, 그레이드 스쿨 매스 8K(Grade School Math 8K) 벤치마크와 같은 테스트에서 모델이 좋은 성과를 거둔다고 해서 반드시 추론 능력을 보여준다고 할 수는 없다고 말했습니다. 그는 "1학년 학생에게 '2 더하기 5가 뭐야?'라고 물었을 때 '7이에요'라고 답하면, 분명 정답입니다. 하지만 이로부터 5학년이 수학적 추론을 완벽하게 습득했다고 결론지을 수 있을까요?"라고 덧붙였습니다.​

이번 연구는 데이터 오염(data contamination)을 주요 문제로 지적했는데, 이는 테스트 문항이 모델의 학습 데이터셋에 포함되어 있어 모델이 답을 추론하는 것이 아니라 암기해서 답을 내는 현상입니다. Mixtral, Phi-3, Gemma를 포함한 여러 모델은 GSM8K 벤치마크와 유사한 신규 문항으로 평가할 때 성능이 최대 13%까지 저하되는 것으로 나타났습니다.​

옥스퍼드 연구의 수석 저자인 앤드루 빈(Andrew Bean)은 업계에서 내놓는 주장들을 그대로 믿어서는 안 된다고 경고했습니다. "모델이 박사 수준의 지능을 가졌다는 것 같은 이야기를 볼 때는 한 번쯤 의심해볼 필요가 있습니다,"라고 빈은 NBC 뉴스에 말했습니다. 이번 연구 결과는 최근 구글이 자사의 Gemma AI 모델이 미국 상원의원에 관한 허위 주장을 생성한 후에 모델을 철회한 상황에서 나왔습니다.

댓글 0
전체 1,366 / 126 페이지
(퍼플렉시티가 정리한 기사)드레스덴 기반 반도체 스타트업 Ferroelectric Memory GmbH(FMC)가 AI 데이터 센터의 전력 소비를 대폭 줄이도록 설계된 에너지 절감형 메모리 칩 상용화를 위해 1억 유로를 확보하며, 유럽 반도체 분야에서 가장 큰 규모의 투자 라운드 중 하나를 기록했습니다. 이번 투자는 AI 인프라가 급증하는 에너지 사용량으로 인해 압박을 받고 있는 가운데 이루어졌으며, 데이터 센터는 현재 미국 전체 전력의 4.4%를 소비하고 있으며, 이 수치는 2028년까지 잠재적으로 3배 증가할 것으로 예상됩니다.7,700만 유로 규모의 지분 투자 라운드는 벤처 캐피털 기업인 HV Capital과 DeepTech & Climate Fonds(DTCF)가 주도했으며, Vsquared Ventures와 eCAPITAL, Bosch Ventures, Air Liquide Venture Capital, M Ventures, Verve Ventures를 포함한 기존 투자자들이 참여했습니다. 추가로 2,300만 유로는 IPCEI ME/CT 프로그램과 유럽혁신위원회를 포함한 공공 자금 출처에서 조달되었습니다.AI의 에너지 위기 해결하기FMC의 DRAM+ 및 3D-CACHE+ 메모리 기술은 CEO Thomas Rückes가 “AI 스택의 주요 병목 현상”이라고 부르는 문제를 해결하는 것을 목표로 합니다. 이 회사의 영구 메모리 칩은 휘발성 및 비휘발성 스토리지 간의 에너지 집약적인 데이터 전송을 제거함으로써 기존 제품 대비 시스템 효율성과 처리 속도를 100% 이상 향상시킬 수 있습니다.“지금까지 대역폭이 AI 컴퓨팅의 지배적인 지표였지만, 이제 에너지 효율성이 차세대 AI의 핵심 요소가 되고 있습니다”라고 Rückes는 성명에서 밝혔습니다. 이 기술은 하프늄 산화물 기반의 강유전체 재료를 기반으로 구축되어 메모리 칩의 비휘발성을 가능하게 하며, 시스템이 전원이 꺼진 상태에서도 정보를 유지할 수 있도록 합니다.유럽의 반도체 추진이번 투자는 FMC를 현재 1,000억 유로 이상 규모의 메모리 칩 시장을 지배하고 있는 미국 및 아시아 메모리 공급업체에 대한 의존도를 줄이려는 유럽의 광범위한 전략의 일부로 자리매김합니다. 메모리 생산은 한국의 거대 기업인 SK하이닉스와 삼성, 그리고 미국 기반의 마이크론에 집중되어 있으며, SK하이닉스는 2025년 2분기 기준 고대역폭 메모리 시장의 62%를 점유하고 있습니다.500개 이상의 기업이 모여 있는 유럽 최대의 마이크로일렉트로닉스 허브인 드레스덴의 실리콘 색소니 클러스터에 위치한 FMC는 전 세계 대량 생산 300mm 생산 시설에서 선도적인 DRAM 제조업체 및 첨단 로직 파운드리와의 파트너십을 통해 자사 기술을 상용화할 계획입니다. DTCF의 토르스텐 뢰플러(Dr. Torsten Löffler) 박사는 “FMC는 데이터 센터의 에너지 소비를 지속 가능하게 줄이는 동시에 반도체 부문에서 유럽의 주권을 강화합니다”라고 말했습니다.
1121 조회
0 추천
2025.11.14 등록
(퍼플렉시티가 정리한 기사)WisdomAI는 AI 기반 데이터 분석 플랫폼으로, Kleiner Perkins가 주도하고 Nvidia의 벤처 캐피탈 부문인 NVentures가 참여한 시리즈 A 펀딩에서 5천만 달러를 유치했다고 11월 12일 발표했습니다. 이번 라운드는 샌마테오에 본사를 둔 이 스타트업이 Coatue가 주도한 시드 펀딩에서 2천3백만 달러를 유치한 지 불과 6개월 만에 이루어졌으며, 2024년 말 출시 이후 총 조달 자본금은 7천3백만 달러에 달합니다.이러한 연이은 자금 조달은 복잡한 비즈니스 데이터에서 안정적으로 인사이트를 추출할 수 있는 엔터프라이즈 AI 솔루션에 대한 투자자들의 급증하는 관심을 반영합니다. WisdomAI는 출시 당시 2개의 엔터프라이즈 고객에서 Cisco, ConocoPhillips, Patreon을 포함한 약 40개로 성장했으며, 한 고객은 불과 몇 개월 만에 10명에서 450명의 사용자로 확대되었습니다.쿼리 우선 접근 방식으로 AI 환각 방지데이터 보안 기업 Rubrik의 공동 창립자이자 전 수석 설계자인 Soham Mazumdar가 설립한 WisdomAI는 AI 분석 도구를 괴롭혀온 지속적인 문제인 환각(hallucination), 즉 조작된 출력 결과를 해결합니다. 이 플랫폼은 대규모 언어 모델을 답변이 아닌 데이터베이스 쿼리 생성에만 독점적으로 사용하여, 결과가 AI 생성 콘텐츠가 아닌 실제 데이터 소스에서 직접 나오도록 보장합니다.Mazumdar는 성명에서 “우리는 모든 직원이 AI를 통해 데이터로 추론할 수 있는 새로운 시대에 진입하고 있습니다”라고 말했습니다. 플랫폼의 독자적인 “기업 컨텍스트 레이어”는 쿼리를 실행하기 전에 고객별 데이터 정의와 특성을 학습하여, 정확성을 유지하면서 지저분하거나 오류가 있는 데이터셋을 처리할 수 있게 합니다.프로액티브 분석이 정적 대시보드를 대체합니다WisdomAI는 최근 주요 지표에서 관련성 있는 변화가 발생했을 때만 사용자에게 알림을 보내는 에이전트 모니터링 기능을 도입하여 일상적인 보고를 제거했습니다. Mazumdar는 이 기능의 배포에 약 5분이 소요되었으며, 분석을 “정적 보고서”에서 역동적이고 사전 예방적인 인사이트로 전환한다고 말했습니다.이번 투자 자금은 WisdomAI의 엔지니어링 팀 확장, 제품 개발 가속화, 그리고 기술, 의료, 금융 서비스, 에너지, 제조 부문의 포춘 500대 기업을 목표로 하는 시장 진출 운영 확대를 지원할 예정입니다. Kleiner Perkins의 주요 투자자 Aditya Naganath는 WisdomAI가 “데이터에는 빠져있지만 인텔리전스에는 굶주린” 기업들의 “악순환을 끊는다”고 말했습니다.이번 투자는 WisdomAI를 빠르게 성장하는 시장 내에 위치시킵니다. 데이터 분석 분야의 글로벌 AI 시장은 2026년에 403억 달러, 2034년까지 3,109억 7천만 달러에 달할 것으로 예상되며, 연평균 복합 성장률 29.10%로 확대되고 있습니다.
1126 조회
0 추천
2025.11.14 등록
(퍼플렉시티가 정리한 기사)Milestone은 기업들이 AI 코딩 도구의 영향을 측정하도록 돕는 이스라엘 스타트업으로, 목요일 Heavybit와 Hanaco Ventures가 주도하고 Atlassian Ventures가 참여한 가운데 1,000만 달러의 시드 펀딩을 확보했다고 발표했습니다. 이번 라운드에는 GitHub 공동 창립자 Tom Preston-Werner, 전 AT&T CEO John Donovan, Datadog 전 사장 Amit Agrawal과 같은 주목할 만한 엔젤 투자자들이 포함되었습니다.이 플랫폼은 AI 코딩 도구가 기업 전반에 확산됨에 따라 증가하는 문제점을 해결합니다. Stack Overflow의 2025년 개발자 설문조사에 따르면, 현재 84%의 개발자가 개발 프로세스에서 AI 도구를 사용하고 있으며, 51%는 매일 사용하고 있습니다. Google CEO Sundar Pichai는 최근 회사의 새로운 코드 중 30% 이상이 AI에 의해 생성된다고 밝혔으며, GitHub Copilot은 사용자 수가 2,000만 명을 넘어섰습니다. 이러한 채택에도 불구하고, 기업들은 이러한 도구로부터의 투자 수익률을 정량화하는 데 어려움을 겪고 있습니다.데이터 통합을 통한 영향력 측정Milestone의 플랫폼은 소스 제어 및 프로젝트 관리 도구에서 HR 시스템 및 AI 코딩 어시스턴트에 이르기까지 조직의 전체 소프트웨어 개발 스택과 연결됩니다. 이 회사는 Cursor, Windsurf, Claude Code를 포함한 주요 플랫폼과 통합하여 엔지니어링 리더에게 개발 워크플로 전반의 AI 도구 사용에 대한 통합 뷰를 제공합니다.이 플랫폼은 AI 도구 사용을 추적하고 코드 품질, 기능 제공 속도, 장기적인 코드 유지보수성과 같은 주요 엔지니어링 메트릭과 연관시킵니다. 주요 기업의 수천 명의 엔지니어에 대한 Milestone의 분석에 따르면, 자율 에이전트가 더 풍부한 프로젝트 및 아키텍처 정보에 연결되면 개발자 처리량이 최대 270%, 코드 정확도가 최대 60% 향상될 수 있습니다.현재 고객으로는 Kayak, Monday.com, Sapiens가 있습니다. CEO이자 공동 창립자인 Liad Elidan은 TechCrunch와의 인터뷰에서 회사의 접근 방식은 고객이 코드베이스에 대한 액세스 권한을 부여해야 하며, 이는 처음에 투자자들로부터 회의적인 반응을 얻었다고 말했습니다.학술적 기원에서 기업 솔루션으로Elidan과 공동 창립자인 Stephen Barrett 교수는 Trinity College Dublin에서 처음 만났으며, 당시 Barrett은 컴퓨터 과학을 가르치고 소프트웨어 엔지니어링 메트릭을 연구하고 있었습니다. 그들의 협력은 엔지니어링 생산성 측정에 관한 수년간의 공동 연구로 발전했으며, 이는 Milestone의 플랫폼을 위한 기초를 마련했습니다. Barrett은 회사의 CTO로 재직하면서 Trinity College에서 계속 강의하고 있으며, 팀의 대부분은 이스라엘에 기반을 두고 있습니다.“Milestone은 엔지니어링 조직 내에서 실제로 일어나고 있는 일을 정량화하여 AI 도입을 측정 가능한 성과로 전환할 수 있도록 함으로써 그 격차를 메웁니다”라고 Elidan은 발표에서 말했습니다.
1146 조회
0 추천
2025.11.14 등록
(퍼플렉시티가 정리한 기사)SwitchBot은 오늘 AI Art Frame 디지털 액자를 공식 출시하며, 컬러 E Ink 기술을 통해 AI 기반 아트워크 생성 기능을 홈 데코에 도입했습니다. 지난 9월 IFA 2025에서 처음 공개된 이 제품은 현재 가장 작은 7.3인치 모델이 $149부터 시작하는 가격으로 구매 가능합니다.스마트 홈 기기 제조업체는 이 액자를 7.3인치, 13.3인치, 31.5인치 세 가지 크기로 제공하며, 가격은 각각 $149.99, $349, $1,299입니다. 회사 발표에 따르면, 이 기기는 E Ink Spectra 6 기술을 사용하여 유화 같은 색상 레이어로 실제 그림의 질감과 깊이를 재현하는 종이 같은 디스플레이를 구현합니다.AI 기반 예술 작품 창작프레임의 AI Studio 기능은 NanoBanana를 기반으로 하며, API를 통해 Google의 Gemini 2.5 Flash Image 모델에 액세스하여 사용자가 텍스트 프롬프트를 사용해 독창적인 작품을 생성하거나 기존 사진과 스케치를 다양한 예술적 스타일로 변환할 수 있게 합니다. 사용자는 SwitchBot 앱을 통해 유화, 수채화 또는 애니메이션 스타일의 예술 작품과 유사한 작품을 만들 수 있습니다.SwitchBot은 월 최대 400개의 AI 생성 이미지를 포함하는 30일 무료 체험을 제공하며, 이후 구독료는 월 $3.99입니다. 이 기기는 또한 디스플레이를 위해 최대 10개의 개인 사진을 로컬에 저장할 수 있습니다.배터리 수명 및 디자인 특징프레임은 내장된 2,000mAh 배터리를 탑재하고 있으며, SwitchBot은 주 1회 이미지 변경을 기준으로 한 번 충전으로 최대 2년까지 사용할 수 있다고 주장합니다. 이 기기는 콘텐츠를 변경할 때만 전력을 소비하며 눈에 보이는 케이블이 없습니다. 알루미늄 합금 프레임은 Ikea의 Rödalm 라인업과 호환되어 사용자가 인테리어에 맞게 외관을 맞춤 설정할 수 있습니다.이 기기는 가로 또는 세로로 표시할 수 있어 책상, 침실 또는 갤러리 벽에 적합합니다. 눈부심 없고 백라이트가 없는 E Ink 디스플레이는 눈에 편안하도록 설계되었으며 다양한 조명 조건에서 전통적인 액자 그림과 유사합니다.
1102 조회
0 추천
2025.11.14 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입