구글, '젬마 3' 내부 동작 파악할 수 있는 도구 오픈 소스 출시
페이지 정보
작성자
이수
작성일
17:31
본문
구글이 오픈 소스 모델인 '젬마 3(Gemma 3)'의 내부 작동 원리를 분석할 수 있는 도구인 '젬마 스코프 2(Gemma Scope 2)'를 출시하며 AI의 '블랙박스' 현상을 규명하기 위한 연구 결과를 공개했습니다.
이 도구 모음은 인공지능이 탈옥이나 환각 증상을 보이거나 아첨하는 태도를 취할 때 내부의 어떤 기능이 활성화되고 네트워크를 통해 어떻게 전달되는지를 실시간으로 추적하여 AI의 안전성과 정렬 상태를 정밀하게 검사할 수 있도록 돕습니다.
특히 모든 레이어에 포함된 '트랜스코더' 기술을 통해 인공지능 내부에서 정보가 어떻게 전파되고 계산되는지 그 구체적인 경로를 파악할 수 있게 함으로써, AI 모델의 신뢰도를 높이고 윤리적인 행동 제어를 가능하게 하는 데 기여할 것으로 기대됩니다.
댓글 0