AI 뉴스

KAIST, 구글 제미나이 AI에서 심각한 보안 결함 발견

페이지 정보

작성자 이수
작성일 2025.12.27 18:56
326 조회
0 추천
0 비추천

본문

2252639238_ucpfuq.jpg


한국과학기술원(KAIST)의 연구진들은 Google Gemini를 포함한 주요 상용 AI 시스템을 구동하는 Mixture-of-Experts 아키텍처의 보안 취약점을 발견했으며, 단 하나의 악의적인 구성 요소가 전체 AI 모델의 안전 메커니즘을 손상시킬 수 있음을 입증했습니다.

전기및전자공학부 신승원 교수와 전산학부 손수엘 교수가 이끄는 연구팀은 12월 12일 하와이에서 열린 Annual Computer Security Applications Conference 2025에서 Distinguished Paper Award를 수상했습니다. "MoEvil: Poisoning Experts to Compromise the Safety of Mixture-of-Experts LLMs"라는 제목의 논문은 MoE 구조의 근본적인 보안 취약점을 체계적으로 분석한 최초의 연구입니다.



효율적인 AI 설계에 숨겨진 위협

Mixture-of-Experts는 현대 대규모 언어 모델이 모든 요청에 대해 전체 시스템을 활성화하는 대신 특정 질문을 전문화된 "전문가" 모델로 라우팅하여 효율성을 향상시키기 위해 사용하는 아키텍처입니다. 이 설계는 컴퓨팅 성능을 절약하지만, KAIST 연구팀은 악의적으로 훈련된 단일 전문가를 오픈 소스로 배포하면 더 큰 AI 시스템에 통합될 때 위험한 취약점을 만들 수 있다는 것을 입증했습니다.
이 공격은 놀라울 정도로 효과적이며 탐지하기 어렵습니다. 연구에 따르면, 여러 전문가 중 단 하나만 손상되어도 유해한 응답 생성 성공률이 0%에서 80%로 급증합니다. 악의적인 전문가는 특정 주제가 언급될 때마다 제어권을 가져와 다른 작업에 대해서는 정상적인 기능을 유지하면서 AI가 위험하거나 제한된 콘텐츠를 생성하도록 강제합니다.
"이 프로세스는 모델 성능 저하를 거의 일으키지 않아 사전에 문제를 탐지하는 것이 극히 어렵습니다. 이것이 가장 중요한 위험 요소로 간주됩니다"라고 연구자들은 연구 결과에서 언급했습니다.


오픈소스 AI 개발에 대한 시사점

이 취약점은 AI 산업이 개발을 가속화하기 위해 공유된 오픈소스 구성 요소에 점점 더 의존함에 따라 특히 중요한 의미를 갖습니다. 이 연구는 전체 성능을 평가하는 것뿐만 아니라 개별 전문가 모델의 출처와 안전성을 검증하는 것이 필수적이 되었음을 강조합니다.
연구팀은 KAIST 전기및전자공학부의 김재한, 송민규 박사과정 학생과 현재에서 근무하는 나승호 박사로 구성되었습니다. 이들의 연구는 한국 과학기술정보통신부, 한국인터넷진흥원, 정보통신기획평가원의 지원을 받았습니다.
정보보안 분야에서 가장 영향력 있는 국제 학회 중 하나인 ACSAC는 올해 전체 제출 논문 중 단 두 편만을 최우수 논문상으로 선정했습니다. 이번 수상은 AI 보안 분야에서 한국 연구자들의 주목할 만한 성과를 나타냅니다.

댓글 0
전체 1,366 / 21 페이지
삼성전자가 엔비디아의 차세대 HBM4 테스트에서 구동 속도와 전력 효율 면에서 ‘최우수’ 평가를 받으며, 내년 공급 물량의 30% 이상을 차지할 것으로 전망된다.삼성전자의 HBM4는 초당 11Gbps 이상의 속도를 구현하고 전력 효율을 전 세대 대비 40% 개선했으며, 올해 3분기 HBM 시장 점유율 22%로 마이크론을 제치고 2위를 탈환했다.HBM4는 내년 하반기 출시 예정인 엔비디아의 차세대 AI 가속기 ‘베라 루빈’에 탑재될 핵심 부품으로, 삼성전자는 1분기 정식 계약 체결 후 2분기부터 본격 공급을 시작할 예정이다.
330 조회
0 추천
2025.12.22 등록
Nvidia는 40,000시간의 게임플레이 영상으로 학습된 오픈소스 AI 모델 NitroGen을 공개했으며, 이는 1,000개 이상의 비디오 게임을 플레이할 수 있고 처음 보는 게임에서 처음부터 학습된 모델 대비 작업 성공률이 52% 향상되었습니다.이 모델은 Nvidia의 GROOT N1.5 로봇공학 아키텍처를 기반으로 구축되었으며, 연구진은 이 기술이 예측 불가능한 환경에서 작동하는 로봇을 포함한 실제 응용 분야를 발전시킬 수 있다고 말하며, 모든 데이터셋, 코드 및 모델 가중치를 공개적으로 공개했습니다.이 발표는 게임 커뮤니티에서 경쟁적인 온라인 게임에서의 잠재적 오용에 대한 우려를 불러일으켰으며, 업계 데이터에 따르면 게이머의 80%가 이미 치팅을 경험하고 있고 이 AI는 인간 플레이어와 봇을 구별하기 어렵게 만들 수 있습니다.
326 조회
0 추천
2025.12.22 등록
• 아마존의 차세대 음성 비서 '알렉사 플러스'가 기존 에코 기기 사용자에게도 확대 적용• 프라임 회원은 "알렉사, 업그레이드"라고 말하면 알렉사 플러스로 전환 가능• 신형 에코 기기와 웹에서 순차적으로 출시 중이나, 과연 진정한 '업그레이드'인지는 의문아마존의 차세대 음성 비서가 서서히 보급되고 있다. 신형 에코 기기에 탑재되어 출시되고 있으며, 일부 사용자들에게는 웹을 통해서도 제공되고 있다. 이제 기존 에코 기기를 보유한 프라임 회원들도 "알렉사, 업그레이드"라고 말하면 알렉사 플러스를 이용할 수 있게 되었다. 다만 남은 질문은 하나다. 이것이 과연 진정한 업그레이드인가?
319 조회
0 추천
2025.12.22 등록
앤트로픽은AI에이전트가특정작업을효율적으로수행하도록돕는‘에이전트스킬’을오픈소스로공개하며기업용AI시장의표준선점에나섰습니다.이는에이전트가업무에필요한지침과리소스를동적으로불러와사용할수있도록지원하는기술적저장소역할을합니다.이기술은대형언어모델의한계인절차적지식부족을보완하며,필요한경우에만세부정보를로드하는방식을통해시스템의효율성을극대화했습니다.사용자는복잡한프롬프트작성없이도데이터분석이나문서작성같은전문워크플로우를모듈형태로간편하게재사용할수있습니다.아틀라시안과피그마등주요글로벌IT기업들이이미도입을시작했으며,이는개별맞춤형모델구축보다훨씬효율적인에이전트생태계를형성할것으로기대됩니다.앤트로픽은이번오픈소스화를통해기술주도권을확보하고,기업들이범용적으로사용할수있는AI에이전트환경을구축하는데집중하고있습니다.
341 조회
0 추천
2025.12.21 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입