Loading...

AI 뉴스

구글 제미나이 라이브 대규모 업데이트, 활용법 3가지

페이지 정보

작성자 symbolika
작성일 2026.01.03 19:35
398 조회
0 추천
0 비추천

본문

Google Gemini Live

• 구글, 제미나이 라이브 출시 후 '역대 최대 규모' 업데이트 배포
• 음성 대화의 자연스러움 향상 - 억양, 뉘앙스, 발음, 리듬 이해력 대폭 개선
• 스토리텔링 시 캐릭터별 다른 억양과 톤 구현 가능
• 학습 기능 강화 - 사용자 속도에 맞춘 튜토리얼 제공
• 다양한 악센트로 응답 가능, 언어 학습에도 활용

구글의 대화형 AI 비서 '제미나이 라이브(Gemini Live)'가 출시 약 1년 6개월 만에 '역대 최대 규모' 업데이트를 받았다. 제미나이 라이브는 음성으로 구글 제미나이 AI와 대화하는 서비스로, 마치 친구와 대화하듯 자연스럽게 질문하고 중간에 끼어들 수도 있다.

이번 업데이트로 제미나이 라이브는 음성, 뉘앙스, 발음, 리듬에 대한 이해력이 크게 향상되어 더욱 자연스러운 대화가 가능해졌다. 외관상 변화는 눈에 띄지 않으며 대부분의 응답도 기존과 비슷해 보이지만, 특정 영역에서는 분명한 차이를 체감할 수 있다. 이 업데이트는 현재 안드로이드와 iOS 제미나이 앱에 순차 배포 중이다.

스토리텔링 기능 강화

제미나이 라이브는 이제 스토리텔링에 더 많은 감정과 변화를 담을 수 있다. 역사 수업, 어린이 취침 동화, 창작 브레인스토밍 등에 유용하게 활용할 수 있다. AI가 적절한 상황에 맞춰 다양한 억양과 톤을 추가해 캐릭터와 장면을 구분하는 데 도움을 준다.

예를 들어 율리우스 카이사르의 관점에서 로마 제국의 역사를 들려달라고 요청할 수 있다. 오만과 편견을 베넷 자매 각각의 시점에서 다시 이야기해달라고 하거나, 100년, 200년, 300년 전 자신의 지역이 어떤 모습이었을지 이야기를 만들어달라고 요청할 수도 있다.

학습 및 교육 기능

제미나이 라이브의 새로운 기능이 돋보이는 또 다른 영역은 교육과 설명이다. 인간 유전학의 복잡한 내용부터 카펫 청소 방법까지, 원하는 주제에 대해 속성 과정이나 상세 튜토리얼을 요청할 수 있다. 언어 학습에도 활용 가능하다.

이제 AI가 사용자의 속도에 맞춰 진행할 수 있어, 새로운 것을 배울 때 특히 유용하다. 느리게, 빠르게, 또는 반복이 필요하면 그냥 말하면 된다. 시간이 제한되어 있다면 그것도 알려주면 된다.

다만 AI 환각 현상에 주의해야 하며, 들은 내용이 완전히 정확한지 맹신해서는 안 된다. 집 조명 재배선이나 자동차 엔진 수리 같은 것을 배울 때는 다른 출처로 교차 확인하는 것이 좋다. 그래도 제미나이 라이브는 유용한 출발점이 될 수 있다.

다양한 억양 구현

이번 업데이트로 제미나이 라이브가 새롭게 갖추게 된 기능 중 하나는 다양한 억양으로 말하는 능력이다. 서부 개척 시대의 역사를 카우보이 말투로 듣거나, 영국 왕실의 복잡한 사정을 정통 런던 억양으로 설명받을 수도 있다.

이는 앞서 언급한 언어 학습에도 적용된다. 원어민이 말하는 것처럼 단어와 문구를 들을 수 있어 발음과 어조를 따라 해볼 수 있다. 제미나이 라이브가 전 세계 모든 언어와 억양을 다루지는 않지만, 상당수를 지원한다.

다만 특정 안전장치가 내장되어 있어 억양과 말투를 비하적으로 사용하려 하거나 실제 인물을 흉내 내려 하면 요청이 거부될 수 있다. 그래도 AI를 테스트하고 더 다양하고 개인화된 응답을 받을 수 있는 재미있는 방법이다.

댓글 0
전체 1,366 / 76 페이지
콘텐츠 크리에이터 Matthew Berman은 절차적으로 생성된 복셀 아트 로봇부터 레이 트레이싱 시뮬레이터, 중력 기반 태양계, 골프 스윙 분석기까지—대화형 프롬프트를 사용하여 12개 이상의 인터랙티브 애플리케이션을 구축함으로써 Gemini 3의 코딩 역량을 시연했다.실험 결과 이 모델은 비교적 적은 프롬프트로 기능적이고 물리적으로 정확한 애플리케이션을 생성할 수 있으며, 협상이 가능한 AI 상대가 있는 모노폴리 보드 게임 생성기와 경제 데이터를 분석하여 AI 버블 위험을 평가하는 버블 시뮬레이션을 포함한다.Gemini 3는 2025년 11월 17일에 출시되었으며, Google이 설명하는 최첨단 멀티모달 추론과 프레임별 비디오 분석 기능을 갖추고 있다—Berman은 골프 스윙 분석기에서 이 기능을 활용하여 개별 비디오 프레임에 걸쳐 성능을 수집하고 평가했다.
780 조회
0 추천
2025.11.23 등록
Figure AI는 390억 달러 가치의 휴머노이드 로봇 스타트업으로, 회사의 로봇이 인간의 두개골을 골절시킬 수 있고 작업자에게 심각한 부상 위험을 초래한다고 경영진에게 경고한 후 해고되었다고 주장하는 전 제품 안전 책임자로부터 연방 소송에 직면해 있습니다.아마존과 그 로봇 부서에서 6년 이상의 경력을 가진 로봇 안전 엔지니어인 Robert Gruendel은 금요일 캘리포니아 북부 지방 연방 지방법원에 소송을 제기했습니다. 고소장은 그가 회사의 휴머노이드 로봇에 대한 “가장 직접적이고 문서화된 안전 불만”을 제기한 지 며칠 후인 9월에 해고되었다고 주장합니다.소송에 따르면, Gruendel은 7월에 충격 테스트를 실시했으며, 로봇이 “초인적인 속도”로 움직이고 “통증 역치의 20배”에 달하는 힘을 발생시킨다는 사실을 발견했습니다. 이는 성인 인간의 두개골을 골절시키는 데 필요한 힘의 두 배 이상입니다. 소송은 또한 오작동하는 로봇이 직원이 근처에 서 있는 동안 “강철 냉장고 문에 ¼인치 깊이의 상처를 새긴” 사건을 설명합니다.안전 계획 하향 조정 의혹소송은 Gruendel이 두 주요 투자자로부터 투자를 확보하는 데 도움이 된 포괄적인 안전 로드맵을 개발했지만, 자금 조달 라운드가 종료된 후 회사 경영진에 의해 이 계획이 “무용지물이 되었다”고 주장합니다. Gruendel은 이것이 “사기로 해석될 수 있다”고 경영진에게 경고한 것으로 알려졌습니다.고소장은 또한 Gruendel이 CEO Brett Adcock과 수석 엔지니어 Kyle Edelberg에게 보낸 메시지에서 로봇의 능력에 대한 우려를 제기했을 때, 그의 경고가 무시되었다고 주장합니다. 소송에 따르면, Gruendel의 안전 지침은 “의무가 아닌 장애물”로 취급되었으며, 그는 해고되기 전에 회사가 “모호한 ‘사업 방향 전환’“을 겪고 있다는 말을 들었습니다.회사, 주장 부인Figure AI는 혐의를 부인하며 CNBC에 Gruendel이 “낮은 업무 성과로 해고되었다”고 밝혔고, 그의 주장은 “Figure가 법정에서 철저히 반박할 허위 사실”이라고 말했다. 회사 대변인은 추가 논평 요청에 즉각 응답하지 않았다.이 소송은 Figure가 9월에 Parkway Venture Capital이 주도하고 Nvidia, Microsoft, Intel Capital 및 기타 주요 투자자들이 참여한 10억 달러 규모의 시리즈 C 펀딩 라운드를 완료한 지 두 달 후에 제기되었다. 이번 라운드는 산호세 소재 회사의 기업 가치를 390억 달러로 평가했으며, 이는 Jeff Bezos, Nvidia, Microsoft로부터 투자를 받았던 2024년 초 기업 가치 대비 15배 증가한 것이다.Gruendel의 변호사는 CNBC에 캘리포니아 법이 안전하지 않은 관행을 보고하는 직원을 보호한다고 말하며, 이것이 휴머노이드 로봇 안전과 관련된 최초의 내부고발 소송 중 하나가 될 수 있다고 언급했다. Gruendel은 배심원 재판과 함께 경제적, 보상적, 징벌적 손해배상을 요구하고 있다.
795 조회
0 추천
2025.11.23 등록
Linus Tech Tips는 딥페이크 기술이 지난 5년 동안 제작이 훨씬 쉬워지고 더욱 그럴듯해졌음을 보여주며, 이 기술이 취약 계층을 노린 사기 등에 악용될 수 있다는 시급한 우려를 제기합니다.팀은 DeepFaceLab을 사용하여 라이너스 세바스찬의 얼굴 사진 7,000장으로 훈련된 딥페이크를 매우 그럴듯하게 제작했으며, 이 과정은 5년 전 시도에 비해 “적어도 100배는 더 쉬웠다”고 밝히기도 했습니다. 또한 일반 하드웨어와 상업용 도구만으로 완전히 AI 기반의 영상을 만들어냈습니다.2024년 전 세계 온라인 사기 피해액은 1조 달러를 넘어섰고, 북미 지역의 딥페이크 사기 사례는 2022년부터 2023년까지 1,740% 급증했으며, 이 영상은 시청자들이 이러한 빠르게 증가하는 위협을 인식하고 피할 수 있도록 돕는 것을 목표로 합니다.
792 조회
0 추천
2025.11.23 등록
개발자 Armin Ronacher는 2025년에도 AI 에이전트 구축이 여전히 어렵다고 주장하며, Vercel AI SDK와 같은 고수준 SDK 추상화는 실제 도구 사용을 처리할 때 제대로 작동하지 않아, 캐싱, 강화, 에이전트 루프 설계에 대한 더 나은 제어를 위해 Anthropic과 OpenAI의 네이티브 플랫폼 SDK로 회귀하게 된다고 설명한다.이 글은 명시적 캐시 관리가 자동 캐싱보다 예상외로 우수하다고 지적하며, Anthropic의 수동 캐시 제어는 개발자가 대화를 분할하고, 컨텍스트를 편집하며, 시스템 프롬프트 이후와 대화 기록 전반에 캐시 포인트를 배치하여 비용을 더 정확하게 예측할 수 있게 한다고 설명한다.Anthropic Claude 모델은 명시적 캐싱 전략을 통해 최대 90%의 비용 절감을 달성할 수 있지만, 에이전트 개발자들은 학습을 위한 상세한 실패 로깅의 이점과 모든 오류를 컨텍스트에 보존하는 데 따르는 토큰 비용 사이의 근본적인 긴장 관계에 직면한다.
800 조회
0 추천
2025.11.23 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입