구글에서 인터넷 없이 사용하는 AI 비서 Gemma 3n 출시, 사용법
페이지 정보
본문

구글에서 인터넷 연결 없이도 사용할 수 있는 온디바이스 AI 비서 Gemma 3n을 플레이스토어에 출시했다고 합니다. 기존 클라우드 기반 AI와 달리 사용자 기기에서 직접 작동하는 방식으로 주목받고 있습니다.
핵심 기술적 특징
Gemma 3n은 구글 딥마인드의 레이어별 임베딩(PLE) 기술과 MatFormer 아키텍처를 활용했다고 합니다. 원시 파라미터 수는 5B와 8B이지만 실제 메모리 사용량은 2GB와 3GB 수준으로 압축되어 RAM 2GB 이하의 저사양 기기에서도 작동한다고 합니다. 이는 기존 2B, 4B 모델과 비슷한 메모리 공간에서 더 큰 모델을 실행할 수 있게 한 기술적 성과라고 할 수 있습니다.
새롭게 추가된 오디오 기능
이번 업데이트의 가장 큰 특징은 오디오 처리 기능 추가라고 합니다. 고품질 음성-텍스트 변환 기능을 통해 다양한 음성 언어에서 오디오를 텍스트로 변환할 수 있고, 음성 번역 기능으로 음성을 다른 언어의 텍스트로 번역할 수 있다고 합니다. 현재는 최대 30초 길이의 오디오 클립을 배치 처리하는 방식이며, 향후 스트리밍 오디오 지원도 계획되어 있다고 합니다.
멀티모달 및 다국어 지원
Gemma 3n은 텍스트, 이미지, 오디오를 모두 처리할 수 있는 멀티모달 기능을 제공한다고 합니다. 특히 일본어, 독일어, 한국어, 스페인어, 프랑스어에서 향상된 다국어 성능을 보인다고 합니다. 또한 여러 모달리티에 걸친 인터리브 입력을 허용하여 복잡한 멀티모달 상호작용도 이해할 수 있다고 합니다.
실제 활용 방법과 접근성
현재 안드로이드 앱은 구글 AI 엣지 갤러리를 통해 플레이스토어에서 다운로드할 수 있으며, 개발자들을 위해서는 GitHub에 소스코드도 공개되어 있다고 합니다. 앱에서는 'Audio Scribe' 기능을 통해 오디오 클립을 업로드하거나 기기 마이크로 녹음하여 음성을 텍스트로 변환하는 것을 직접 체험할 수 있다고 합니다. 향후 iOS 앱과 스트리밍 오디오 기능도 출시될 예정이라고 합니다.