Loading...

AI 뉴스

KAIST, 구글 제미나이 AI에서 심각한 보안 결함 발견

페이지 정보

작성자 이수
작성일 2025.12.27 18:56
360 조회
0 추천
0 비추천

본문

2252639238_ucpfuq.jpg


한국과학기술원(KAIST)의 연구진들은 Google Gemini를 포함한 주요 상용 AI 시스템을 구동하는 Mixture-of-Experts 아키텍처의 보안 취약점을 발견했으며, 단 하나의 악의적인 구성 요소가 전체 AI 모델의 안전 메커니즘을 손상시킬 수 있음을 입증했습니다.

전기및전자공학부 신승원 교수와 전산학부 손수엘 교수가 이끄는 연구팀은 12월 12일 하와이에서 열린 Annual Computer Security Applications Conference 2025에서 Distinguished Paper Award를 수상했습니다. "MoEvil: Poisoning Experts to Compromise the Safety of Mixture-of-Experts LLMs"라는 제목의 논문은 MoE 구조의 근본적인 보안 취약점을 체계적으로 분석한 최초의 연구입니다.



효율적인 AI 설계에 숨겨진 위협

Mixture-of-Experts는 현대 대규모 언어 모델이 모든 요청에 대해 전체 시스템을 활성화하는 대신 특정 질문을 전문화된 "전문가" 모델로 라우팅하여 효율성을 향상시키기 위해 사용하는 아키텍처입니다. 이 설계는 컴퓨팅 성능을 절약하지만, KAIST 연구팀은 악의적으로 훈련된 단일 전문가를 오픈 소스로 배포하면 더 큰 AI 시스템에 통합될 때 위험한 취약점을 만들 수 있다는 것을 입증했습니다.
이 공격은 놀라울 정도로 효과적이며 탐지하기 어렵습니다. 연구에 따르면, 여러 전문가 중 단 하나만 손상되어도 유해한 응답 생성 성공률이 0%에서 80%로 급증합니다. 악의적인 전문가는 특정 주제가 언급될 때마다 제어권을 가져와 다른 작업에 대해서는 정상적인 기능을 유지하면서 AI가 위험하거나 제한된 콘텐츠를 생성하도록 강제합니다.
"이 프로세스는 모델 성능 저하를 거의 일으키지 않아 사전에 문제를 탐지하는 것이 극히 어렵습니다. 이것이 가장 중요한 위험 요소로 간주됩니다"라고 연구자들은 연구 결과에서 언급했습니다.


오픈소스 AI 개발에 대한 시사점

이 취약점은 AI 산업이 개발을 가속화하기 위해 공유된 오픈소스 구성 요소에 점점 더 의존함에 따라 특히 중요한 의미를 갖습니다. 이 연구는 전체 성능을 평가하는 것뿐만 아니라 개별 전문가 모델의 출처와 안전성을 검증하는 것이 필수적이 되었음을 강조합니다.
연구팀은 KAIST 전기및전자공학부의 김재한, 송민규 박사과정 학생과 현재에서 근무하는 나승호 박사로 구성되었습니다. 이들의 연구는 한국 과학기술정보통신부, 한국인터넷진흥원, 정보통신기획평가원의 지원을 받았습니다.
정보보안 분야에서 가장 영향력 있는 국제 학회 중 하나인 ACSAC는 올해 전체 제출 논문 중 단 두 편만을 최우수 논문상으로 선정했습니다. 이번 수상은 AI 보안 분야에서 한국 연구자들의 주목할 만한 성과를 나타냅니다.

댓글 0
전체 1,366 / 43 페이지
Google은 12월 8일 오전 10시(태평양 표준시)에 30분간 라이브스트림을 개최하여 확장 현실 플랫폼인 Android XR의 업데이트를 공개할 예정이며, Gemini AI 통합이 적용된 헤드셋 및 스마트 안경의 새로운 기능에 중점을 둘 것입니다.이 행사는 10월에 출시된 Samsung의 Galaxy XR 헤드셋 출시에 이어 진행되는 것으로, 이는 1,799달러 가격의 첫 번째 Android XR 기기로서 4K 디스플레이와 손동작, 시선 추적, 음성 명령을 통한 AI 기반 상호작용을 특징으로 합니다.티저 자료에 따르면 Google은 2026년 출시 예정인 Samsung의 차기 스마트 안경을 선보일 가능성이 있으며, 이는 Apple의 부진한 Vision Pro 및 Meta의 보다 성공적인 Ray-Ban 스마트 안경과 경쟁하기 위한 것입니다.
495 조회
0 추천
2025.12.02 등록
• 한국 정부는 엔비디아로부터 약 1만3천 개의 GPU를 공급받아 국내 반입을 완료했으며, 이는 지난 5월 추경예산에서 확보한 1조4600억 원으로 집행됐다고 과학기술정보통신부가 1일 밝혔다.• 도입된 GPU에는 최신 B200 모델과 이전 세대 제품이 포함되어 있으며, 정부는 내년 초부터 대학·연구소·스타트업 등에 우선 배정하고 공공 분야에도 투입할 계획이다.• 이는 젠슨 황 CEO가 지난 10월 방한 시 약속한 총 26만여 장 규모(정부 5만 개, 삼성·SK·현대차 각 최대 5만 개, 네이버클라우드 6만 개)의 GPU 공급 계획 중 첫 물량이다.
510 조회
0 추천
2025.12.02 등록
Persistent Systems의 Dattaraj Rao는 VentureBeat에서 온톨로지(기업 맞춤형 개념, 계층 구조, 관계의 정의)가 AI 에이전트가 엔터프라이즈 데이터와 프로세스를 오해하지 않도록 필수적인 가드레일 역할을 한다고 주장합니다. 수십억 달러가 에이전트 인프라에 투자되었음에도 불구하고 실제 성공 사례는 제한적이라는 점을 지적합니다.기사에서는 엔터프라이즈 데이터의 단편화로 인해 중요한 모호성이 발생하는데, 예를 들어 “고객”이라는 단어가 Sales CRM에서는 한 종류의 사람을, 재무 시스템에서는 또 다른 종류의 사람을 의미할 수 있기 때문에, Neo4j와 같은 그래프 데이터베이스를 활용한 온톨로지 기반 접근 방식이 에이전트가 내장된 비즈니스 규칙을 따르면서 질의할 수 있는 통합된 진실의 원천을 마련해야 한다고 설명합니다.이러한 온톨로지 기반 아키텍처는 시급한 엔터프라이즈 과제를 해결합니다. AI의 환각(hallucination) 현상은 기업에게 큰 컴플라이언스와 의사결정 리스크를 야기할 수 있으며, 기술에 대한 관심이 빠르게 증가하고 있음에도 불구하고 실제로 에이전트 기반 AI 워크플로우를 성공적으로 확장한 기업은 11%에 불과하다고 밝혔습니다.
500 조회
0 추천
2025.12.01 등록
• ChatGPT는 11월 30일 3주년을 맞아 주간 활성 사용자 8억 명을 기록하며, 2022년 출시 이후 역사상 가장 빠르게 성장한 소비자 애플리케이션 중 하나가 되었습니다.[kmph +1]• Google의 Gemini 3 Pro는 11월 18일 출시되어 현재 벤치마크 리더보드 1위를 차지하고 있으며, 경쟁이 심화됨에 따라 OpenAI CEO Sam Altman이 직원들에게 “어려운 시기”와 “일시적인 경제적 장애물”에 대해 경고하게 만들었습니다.[axios +1]• Deakin University 연구에 따르면 ChatGPT는 학술 인용의 약 5분의 1을 조작했으며, 전체 인용의 56%가 가짜이거나 오류를 포함하고 있어 지속적인 정확성 문제를 부각시켰습니다.[studyfinds]
482 조회
0 추천
2025.12.01 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입