AI 뉴스

연구들이 AI 훈련 데이터와 테스트의 결함을 드러내다

페이지 정보

작성자 xtalfi
작성일 2025.11.07 14:52
1,129 조회
0 추천
0 비추천

본문

251105-ai-safety-tests-lr-10661e.jpg

(퍼플렉시티가 정리한 기사)


이번 주에 발표된 두 가지 주요 연구는 인공지능 시스템이 구축되고 평가되는 방식의 심각한 약점을 드러내며, AI 능력이 과장되어 왔는지에 대한 의문을 제기하고 있다.

Sony AI는 11월 5일 컴퓨터 비전 모델의 편향성을 드러내기 위해 설계된 데이터셋인 Fair Human-Centric Image Benchmark를 공개했으며, 옥스퍼드 인터넷 연구소와 영국 정부의 AI 보안 연구소 연구원들은 AI 성능을 측정하는 데 사용되는 테스트의 광범위한 결함을 밝히는 연구를 발표했다. 이러한 연구 결과들은 많은 AI 시스템이 윤리적으로 문제가 있는 데이터로 훈련되고 신뢰할 수 없는 방법으로 평가될 수 있음을 시사한다.​


훈련 데이터에 동의와 다양성이 부족함

Sony AI가 Nature에 발표한 새로운 벤치마크는 연구자들이 컴퓨터 비전 시스템에서 "편향되고 윤리적으로 문제가 있는 학습 데이터의 지속적인 과제"라고 부르는 문제를 다룹니다. 이 데이터셋은 81개국 1,981명의 개인이 찍힌 10,318장의 이미지로 구성되어 있으며, 모두 사전 동의와 공정한 보상을 받아 수집되었습니다—이는 업계 관행과 크게 다른 방식입니다.​

Sony Group의 AI 거버넌스 글로벌 책임자인 Alice Xiang은 컴퓨터 비전이 객관적이지 않다고 강조했습니다. "컴퓨터 비전은 학습 데이터에 반영된 편향에 따라 사물을 왜곡할 수 있습니다"라고 그녀는 말했습니다. 데이터셋은 기존 AI 모델 중 공정성 테스트를 완전히 통과한 모델이 없다는 것을 보여주었습니다. 일부 모델은 "she/her/hers" 대명사를 사용하는 사람들에 대해 낮은 정확도를 보였으며, 벤치마크는 이를 더 큰 헤어스타일 변동성—이전에 간과되었던 요인—으로 추적했습니다. 직업에 대한 중립적인 질문을 받았을 때, 테스트된 모델들은 특정 인구통계학적 그룹에 대해 특히 고정관념을 강화했으며, 때로는 피사체를 성매매 종사자, 마약상 또는 도둑으로 묘사했습니다.​


벤치마크 테스트가 신뢰할 수 없고 오해의 소지가 있는 것으로 밝혀짐

옥스퍼드 연구팀은 445개 AI 벤치마크를 조사한 결과, 거의 모든 벤치마크에 기술 기업들이 주장하는 결과의 신뢰성을 "약화시키는 결함"이 있음을 발견했습니다. 벤치마크 중 통계적 테스트를 통해 신뢰성을 증명한 것은 16%에 불과했습니다.​

핵심적인 문제는 구성 타당성(construct validity), 즉 테스트가 실제로 그들이 측정한다고 주장하는 것을 제대로 측정하는지에 관한 것입니다. 옥스퍼드 인터넷 연구소의 수석 연구원인 아담 마디(Adam Mahdi)는 NBC 뉴스와의 인터뷰에서, 그레이드 스쿨 매스 8K(Grade School Math 8K) 벤치마크와 같은 테스트에서 모델이 좋은 성과를 거둔다고 해서 반드시 추론 능력을 보여준다고 할 수는 없다고 말했습니다. 그는 "1학년 학생에게 '2 더하기 5가 뭐야?'라고 물었을 때 '7이에요'라고 답하면, 분명 정답입니다. 하지만 이로부터 5학년이 수학적 추론을 완벽하게 습득했다고 결론지을 수 있을까요?"라고 덧붙였습니다.​

이번 연구는 데이터 오염(data contamination)을 주요 문제로 지적했는데, 이는 테스트 문항이 모델의 학습 데이터셋에 포함되어 있어 모델이 답을 추론하는 것이 아니라 암기해서 답을 내는 현상입니다. Mixtral, Phi-3, Gemma를 포함한 여러 모델은 GSM8K 벤치마크와 유사한 신규 문항으로 평가할 때 성능이 최대 13%까지 저하되는 것으로 나타났습니다.​

옥스퍼드 연구의 수석 저자인 앤드루 빈(Andrew Bean)은 업계에서 내놓는 주장들을 그대로 믿어서는 안 된다고 경고했습니다. "모델이 박사 수준의 지능을 가졌다는 것 같은 이야기를 볼 때는 한 번쯤 의심해볼 필요가 있습니다,"라고 빈은 NBC 뉴스에 말했습니다. 이번 연구 결과는 최근 구글이 자사의 Gemma AI 모델이 미국 상원의원에 관한 허위 주장을 생성한 후에 모델을 철회한 상황에서 나왔습니다.

댓글 0
전체 1,366 / 179 페이지
(퍼플렉시티가 정리한 기사)Google은 마샤 블랙번(Marsha Blackburn) 상원의원이 자사 시스템이 그녀에 대한 성폭행 혐의를 조작했다고 비난한 후, Gemma 인공지능 모델의 공개 접근을 중단했습니다. 이는 공인을 대상으로 한 AI 생성 허위 정보에 대한 우려가 커지고 있음을 보여줍니다.테네시주 공화당 의원인 블랙번은 목요일 구글 CEO 순다르 피차이(Sundar Pichai)에게 서한을 보내 답변을 요구했습니다. Gemma가 그녀의 1987년 주 상원 선거 운동 중 주 경찰관과 비합의적 성관계를 가졌다는 혐의를 받았다고 허위로 주장한 후였습니다. AI는 심지어 이 허위 서사를 뒷받침하기 위해 조작된 뉴스 기사에 대한 가짜 링크까지 생성했습니다. 그러나 블랙번은 실제로 1998년까지 공직에 출마하지 않았으며, 그러한 혐의는 전혀 제기된 적이 없습니다.명예훼손 주장 속에서 기술 대기업이 접근을 제한하다구글은 금요일 Gemma를 AI Studio 플랫폼에서 제거하고, 해당 모델의 접근 범위를 개발자 전용 API로 제한한다고 발표했다. 회사는 “Gemma가 소프트웨어 개발자 전용으로 설계되었음에도 불구하고, 비개발자들이 AI Studio에서 Gemma를 사용하여 사실 질문을 시도하는 사례가 보고되었다”고 밝혔다.블랙번은 AI가 생성한 거짓 정보를 뜻하는 기술 업계 용어인 ‘환각(hallucination)’에 대해 언급하며, 피차이에게 “이것은 무해한 ‘환각’이 아니다”라고 썼다. “이는 구글이 소유한 AI 모델이 만들어내고 유포한 명예훼손 행위”라고도 했다. 그녀는 11월 6일까지 시스템이 어떻게 허위 사실을 생성했는지와, 향후 유사한 사고를 방지하기 위해 구글이 취할 조치에 대해 구체적인 답변을 요구했다.이번 논란은 보수 활동가 로비 스타벅이 구글을 상대로 유사한 소송을 제기한 데서 비롯된 것이다. 그는 구글의 AI 시스템이 자신을 “아동 강간범” 및 “상습 성범죄자”로 잘못 표기했다고 주장하며 1,500만 달러 이상의 손해배상을 청구하고 있다. 스타벅의 사례는 2023년 이후 구글의 Bard, Gemini, Gemma 모델이 수백만 사용자에게 허위 정보를 전파한 데에 관련되어 있다.산업 전반의 AI 정확도 과제이 사건들은 기술 업계 전반에 걸쳐 AI “환각” 현상의 지속적인 문제를 부각시키고 있으며, 대규模 언어 모델이 거짓 정보를 사실인 것처럼 자신 있게 제시하는 현상을 보여줍니다. 구글은 “환각 현상은 AI 업계 전반의 과제이며, 특히 Gemma와 같은 소규모 오픈 모델에서 더욱 그러하다”고 인정했습니다.법률 전문가들은 AI 명예훼손 사건의 새로운 패턴이 법원과 기술 기업들에게 새로운 도전 과제를 제기한다고 지적합니다. 유사한 사건들은 전 세계적으로 공인들에게 영향을 미쳤으며, 여기에는 마이크로소프트의 AI 도구가 자신을 유죄 판결을 받은 아동 성범죄자로 잘못 묘사한 것을 발견한 독일 언론인의 사례도 포함됩니다.구글은 Gemma가 소비자용 챗봇이 아닌 애플리케이션 구축을 위한 개발자 도구로 의도되었다고 밝히며 자사의 입장을 옹호했습니다. 회사는 AI 환각 현상을 줄이기 위한 노력을 강조하는 한편, 의도적인 사용자들이 AI 시스템을 조작하여 오해의 소지가 있는 콘텐츠를 생성할 수 있다는 점을 유지했습니다.
1309 조회
0 추천
2025.11.04 등록
(퍼플렉시티가 정리한 기사)SK하이닉스가 인공지능(AI) 시대를 맞아 단순한 메모리 공급자를 넘어 고객 맞춤형 솔루션을 제공하는 ‘풀스택 AI 메모리 크리에이터’로의 전환을 선언했다. 이는 폭발적으로 증가하는 AI 메모리 수요에 대응하고, 메모리 반도체 업계의 경쟁 패러다임이 가격에서 솔루션 중심으로 변화하는 가운데 나온 전략적 전환이다.곽노정 SK하이닉스 대표는 3일 서울 코엑스에서 열린 ‘SK AI 서밋 2025’에서 “AI 시대 메모리의 중요성이 더욱 커지면서 단순한 제조 업체가 아닌 고객과 미래를 함께 설계하는 크리에이터로 거듭날 것”이라고 밝혔다.2030년까지 차세대 HBM 로드맵 공개SK하이닉스는 이번 서밋에서 2030년까지의 구체적인 차세대 고대역폭메모리(HBM) 로드맵을 처음 공개했다. 2026년부터 HBM4 16단과 HBM4E 8·12·16단, 커스텀 HBM4E를 순차 출시하고, 2029년부터 2031년 사이에는 HBM5와 HBM5E를 선보일 예정이다.특히 주목받는 것은 커스텀 HBM 기술이다. 이는 고객의 요청사항을 반영해 그래픽처리장치(GPU)나 주문형반도체(ASIC)의 일부 기능을 HBM 베이스 다이로 옮겨 성능을 극대화하고 전력 소모를 줄이는 맞춤형 솔루션이다.박경 SK하이닉스 부사장은 “2030년에 웨이퍼 기준으로 D램이 4100만장 필요하지만 실제 공급 가능한 물량은 3000만장에 불과하다”며 “메모리 비즈니스가 과거 범용 위주를 넘어 관계가 중요한 힘을 가진 방향으로 재편될 것”이라고 전망했다.글로벌 AI 기업들과 전방위 협력 강화SK하이닉스는 AI 메모리 크리에이터로서의 역할을 강화하기 위해 글로벌 주요 기업들과의 협력을 확대하고 있다. 엔비디아와는 HBM 협력뿐 아니라 옴니버스, 디지털 트윈을 활용한 AI 제조 혁신을 추진하고 있으며, 오픈AI와는 고성능 메모리 공급을 위한 장기 협력을 모색 중이다.또한 TSMC와는 차세대 HBM 베이스 다이 개발 협력을, 샌디스크와는 차세대 낸드 기술인 고대역폭플래시(HBF) 국제 표준화를 공동 추진하고 있다. 네이버클라우드와는 AI 데이터센터 효율화를 위한 차세대 메모리와 소프트웨어 최적화 협력도 진행 중이다.한편 SK하이닉스는 이날 한국거래소로부터 투자주의종목으로 지정됐다. 최근 1년간 주가가 200% 이상 상승하고 특정 계좌의 매수 관여율이 기준을 초과했기 때문이다. 3일 SK하이닉스 주가는 10.9% 급등한 62만원대로 마감했으며, 올해 들어 상승률만 257%에 달한다.
1282 조회
0 추천
2025.11.04 등록
(퍼플렉시티가정리한기사)LG전자가글로벌데이터센터인프라기업플렉스(Flex)와손잡고인공지능(AI)데이터센터의발열문제를해결할모듈형냉각솔루션개발에나선다고4일발표했다.​양사는최근업무협약(MOU)을체결하고LG전자의칠러(초대형냉방기),냉각수분배장치(CDU),컴퓨터룸공기처리장치(CRAH)등고효율냉각제품과플렉스의IT·전력인프라를결합한모듈형데이터센터냉각솔루션을공동개발할계획이다.​확장성과유연성극대화한모듈기반구조새로개발될모듈형냉각솔루션은데이터센터인프라의확장성과유연성을극대화하기위해모듈기반구조로설계된다.사전조립과테스트를마친냉각모듈형태로제작돼현장에서다른모듈들과결합되는방식으로,필요에따라냉각모듈을쉽게추가할수있어데이터센터인프라확장에유리하다.​또한데이터센터의열관리요구사항에맞춰맞춤형으로구성할수있고빠른배포와설치가가능해기존냉각솔루션과차별화된다.양사는이번협업을통해데이터센터구축과정을간소화하고고객들에게혁신적인확장형데이터센터인프라를제공할수있을것으로기대하고있다.​급성장하는AI데이터센터냉각시장선점이번협업은AI데이터센터시장의급속한성장과맞물려주목받고있다.글로벌데이터센터냉각시장규모는2025년177억달러에서2035년629억달러로연평균13.5%성장할것으로전망된다.특히AI수요증가로데이터센터의전력소모와발열이기하급수적으로늘어나면서효율적인냉각기술의중요성이급격히커지고있다.​플렉스는전자제품위탁생산(EMS)분야를선도하는글로벌기업으로,데이터센터를비롯해자동차,헬스케어,통신등다양한산업에설계·개발·제조·공급망관리·사후서비스를아우르는종합솔루션을제공한다.올해타임지가선정한'세계최고기업2025'에도이름을올렸다.​마이클하퉁플렉스사장겸최고상업책임자는"LG전자와협력해데이터센터의열문제를해결하는최적의냉각솔루션을고객들에게제공할것"이라고말했다.이재성LG전자ES사업본부장부사장은"플렉스와의협업은단순한파트너십을넘어고객에게혁신적이고차별화된가치를제공하는동시에,AI데이터센터시장에서LG전자의입지를강화하는전략적기회가될것"이라고강조했다.
1183 조회
0 추천
2025.11.04 등록
(퍼플렉시티가정리한기사)마이크로소프트가UAE와호주등에총33조원규모의대규모AI인프라투자를단행하며글로벌인공지능시장확장에박차를가하고있다.이번투자는AI컴퓨팅자원부족을해결하고'네오클라우드'시장에서의경쟁력을강화하려는전략으로분석된다.트럼프행정부첫GPU수출허가로UAE투자탄력브래드스미스마이크로소프트사장은3일(현지시간)UAE에2029년까지총152억달러(약21조8000억원)를투자하겠다고발표했다.이는2023년부터현재까지투자한73억달러에추가로79억달러를더투입하는것이다.​특히마이크로소프트는지난9월트럼프행정부들어처음으로AI연산용그래픽처리장치(GPU)를UAE에수출할수있는허가를획득했다.이번허가로엔비디아A100칩6만400개상당의GPU와최신GB300GPU까지수출할수있게됐다.​UAE의AI이용률이59.4%로세계1위를기록하고있어AI빅테크들의투자가집중되고있다.마이크로소프트는이미UAE국영AI기업G42에15억달러를지분투자했으며,AI·클라우드인프라에46억달러를지출했다.​호주IREN과14조원계약으로네오클라우드시장진출마이크로소프트는같은날호주AI인프라기업아이렌(IREN)과5년간97억달러(약14조원)규모의클라우드서비스계약을체결했다고발표했다.이번계약으로마이크로소프트는아이렌의최대고객이됐다.​아이렌은엔비디아의최신GB300아키텍처GPU를적용한클라우드서비스를제공하며,관련장비를델에서58억달러에구매해텍사스주데이터센터에배치할예정이다.계약발표직후아이렌주가는24.7%급등했다.​아이렌은원래비트코인채굴업체에서AI인프라기업으로전환한대표적인'네오클라우드'기업이다.네오클라우드는범용클라우드와달리AI연산에특화된고성능컴퓨팅환경을제공하는차세대클라우드서비스를의미한다.​AI컴퓨팅자원확보전쟁본격화마이크로소프트의연이은대형계약은AI시장급성장속에서컴퓨팅자원부족문제를선제적으로해결하려는전략으로해석된다.기존데이터센터구축보다전문업체와의장기계약을통해AI서버용량을확보하는것이더효율적이기때문이다.​마이크로소프트는이번계약외에도AI클라우드스타트업람다(Lambda)와수십억달러규모의엔비디아GPU사용계약을체결했으며,지난9월에는네비우스와5년간174억달러규모의인프라구매계약을맺은바있다.​업계전문가들은이러한움직임을단순한서버임대가아닌'AI연산자원의장기적선점전략'으로평가하고있다.AI학습과서비스운영에필요한막대한GPU자원을미리확보해향후AI시장에서의경쟁우위를확보하려는것으로분석된다.
1179 조회
0 추천
2025.11.04 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입