AI 뉴스

구글 제미나이 라이브 대규모 업데이트, 활용법 3가지

페이지 정보

작성자 symbolika
작성일 01.03 19:35
284 조회
0 추천
0 비추천

본문

Google Gemini Live

• 구글, 제미나이 라이브 출시 후 '역대 최대 규모' 업데이트 배포
• 음성 대화의 자연스러움 향상 - 억양, 뉘앙스, 발음, 리듬 이해력 대폭 개선
• 스토리텔링 시 캐릭터별 다른 억양과 톤 구현 가능
• 학습 기능 강화 - 사용자 속도에 맞춘 튜토리얼 제공
• 다양한 악센트로 응답 가능, 언어 학습에도 활용

구글의 대화형 AI 비서 '제미나이 라이브(Gemini Live)'가 출시 약 1년 6개월 만에 '역대 최대 규모' 업데이트를 받았다. 제미나이 라이브는 음성으로 구글 제미나이 AI와 대화하는 서비스로, 마치 친구와 대화하듯 자연스럽게 질문하고 중간에 끼어들 수도 있다.

이번 업데이트로 제미나이 라이브는 음성, 뉘앙스, 발음, 리듬에 대한 이해력이 크게 향상되어 더욱 자연스러운 대화가 가능해졌다. 외관상 변화는 눈에 띄지 않으며 대부분의 응답도 기존과 비슷해 보이지만, 특정 영역에서는 분명한 차이를 체감할 수 있다. 이 업데이트는 현재 안드로이드와 iOS 제미나이 앱에 순차 배포 중이다.

스토리텔링 기능 강화

제미나이 라이브는 이제 스토리텔링에 더 많은 감정과 변화를 담을 수 있다. 역사 수업, 어린이 취침 동화, 창작 브레인스토밍 등에 유용하게 활용할 수 있다. AI가 적절한 상황에 맞춰 다양한 억양과 톤을 추가해 캐릭터와 장면을 구분하는 데 도움을 준다.

예를 들어 율리우스 카이사르의 관점에서 로마 제국의 역사를 들려달라고 요청할 수 있다. 오만과 편견을 베넷 자매 각각의 시점에서 다시 이야기해달라고 하거나, 100년, 200년, 300년 전 자신의 지역이 어떤 모습이었을지 이야기를 만들어달라고 요청할 수도 있다.

학습 및 교육 기능

제미나이 라이브의 새로운 기능이 돋보이는 또 다른 영역은 교육과 설명이다. 인간 유전학의 복잡한 내용부터 카펫 청소 방법까지, 원하는 주제에 대해 속성 과정이나 상세 튜토리얼을 요청할 수 있다. 언어 학습에도 활용 가능하다.

이제 AI가 사용자의 속도에 맞춰 진행할 수 있어, 새로운 것을 배울 때 특히 유용하다. 느리게, 빠르게, 또는 반복이 필요하면 그냥 말하면 된다. 시간이 제한되어 있다면 그것도 알려주면 된다.

다만 AI 환각 현상에 주의해야 하며, 들은 내용이 완전히 정확한지 맹신해서는 안 된다. 집 조명 재배선이나 자동차 엔진 수리 같은 것을 배울 때는 다른 출처로 교차 확인하는 것이 좋다. 그래도 제미나이 라이브는 유용한 출발점이 될 수 있다.

다양한 억양 구현

이번 업데이트로 제미나이 라이브가 새롭게 갖추게 된 기능 중 하나는 다양한 억양으로 말하는 능력이다. 서부 개척 시대의 역사를 카우보이 말투로 듣거나, 영국 왕실의 복잡한 사정을 정통 런던 억양으로 설명받을 수도 있다.

이는 앞서 언급한 언어 학습에도 적용된다. 원어민이 말하는 것처럼 단어와 문구를 들을 수 있어 발음과 어조를 따라 해볼 수 있다. 제미나이 라이브가 전 세계 모든 언어와 억양을 다루지는 않지만, 상당수를 지원한다.

다만 특정 안전장치가 내장되어 있어 억양과 말투를 비하적으로 사용하려 하거나 실제 인물을 흉내 내려 하면 요청이 거부될 수 있다. 그래도 AI를 테스트하고 더 다양하고 개인화된 응답을 받을 수 있는 재미있는 방법이다.

댓글 0
전체 1,366 / 13 페이지
네이버클라우드가 텍스트·이미지·음성을 단일 모델에서 통합 학습하는 국내 첫 네이티브 옴니모달 AI 모델 ‘하이퍼클로바X SEED 8B Omni’와 추론형 모델 ‘32B Think’를 과학기술정보통신부의 독자 AI 프로젝트 첫 성과로 29일 오픈소스 공개했다.32B Think 모델은 올해 수능 문제 풀이에서 국어·수학·영어·한국사 전 과목 1등급을 달성하고 영어·한국사 만점을 기록했으며, 글로벌 AI 평가 벤치마크에서 주요 해외 모델과 유사한 성능을 보였다.네이버클라우드는 기존 인터넷 문서 중심 학습을 넘어 현실 세계 맥락 데이터 확보에 집중하며, 검색·커머스·공공·산업 등 다양한 분야에서 활용 가능한 AI 에이전트를 단계적으로 확장할 계획이다.
303 조회
0 추천
2025.12.29 등록
카카오는 정부 주도 GPU 확보 사업에서 연내 목표치의 4배를 초과하는 255노드(GPU 2040장)를 경기 안산 데이터센터에 조기 구축 완료했다고 29일 밝혔다.지난 8월 최종 사업자로 선정된 카카오는 AI 3대 강국을 위한 핵심 인프라로 엔비디아 B200 GPU 총 2424장을 확보해 5년간 위탁 운영하며 국내 AI 연구·개발을 지원할 계획이다.카카오는 자체 데이터센터의 전력·냉각 시스템과 공급사와의 긴밀한 협력으로 조기 구축에 성공했으며, 내년 1월부터 산·학·연 과제에 베타서비스를 제공할 예정이다.
307 조회
0 추천
2025.12.29 등록
구글이오픈소스모델인'젬마3(Gemma3)'의내부작동원리를분석할수있는도구인'젬마스코프2(GemmaScope2)'를출시하며AI의'블랙박스'현상을규명하기위한연구결과를공개했습니다.이도구모음은인공지능이탈옥이나환각증상을보이거나아첨하는태도를취할때내부의어떤기능이활성화되고네트워크를통해어떻게전달되는지를실시간으로추적하여AI의안전성과정렬상태를정밀하게검사할수있도록돕습니다.특히모든레이어에포함된'트랜스코더'기술을통해인공지능내부에서정보가어떻게전파되고계산되는지그구체적인경로를파악할수있게함으로써,AI모델의신뢰도를높이고윤리적인행동제어를가능하게하는데기여할것으로기대됩니다.
297 조회
0 추천
2025.12.29 등록
구글은생성AI가단순히텍스트답변을내놓는것을넘어,대화맥락에맞는사용자인터페이스(UI)를직접생성할수있도록돕는오픈소스프로토콜'A2UI'를출시했습니다.기존에는AI가HTML코드등을보내UI를구현하려했으나,보안위험과앱디자인과의부조화문제가있었습니다.A2UI는UI구성요소를'데이터(JSON)'형태로전달하여각앱의프레임워크에맞춰안전하고자연스럽게렌더링하도록설계되었습니다.이프로토콜의가장큰특징은보안성과유연성입니다.실행가능한코드가아닌사전에약속된컴포넌트정보만주고받기때문에임의스크립트실행과같은보안공격을방지할수있습니다.또한앵귤러,플러터,리액트등다양한개발환경에서재사용이가능하며,AI가계산을수행하는동안UI가실시간으로구성되는스트리밍방식의점진적렌더링을지원해사용자경험을크게향상시킵니다.A2UI는여러기업의AI에이전트들이협업하는'멀티에이전트'환경에서복잡한작업을효율적으로처리하기위해개발되었습니다.예를들어레스토랑예약처럼텍스트로만대화하기번거로운상황에서AI가즉시예약폼이나버튼을생성해사용자에게보여줌으로써작업속도를높여줍니다.구글은이표준기술을통해서로다른시스템의AI들이안전하고일관된방식으로사용자와소통할수있는기반을마련할계획입니다.
312 조회
0 추천
2025.12.28 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입