구글, 실시간 음성 에이전트를 위한 제미나이 라이브 API 출시
페이지 정보
작성자
nedge
작성일
2025.12.13 06:00
본문
Google [ -1.03%]은 Vertex AI에서 Gemini 2.5 Flash Native Audio 모델을 기반으로 하는 Gemini Live API를 출시하여, 기업들이 별도의 텍스트 음성 변환 없이 오디오를 네이티브로 처리하는 실시간 음성 및 비디오 에이전트를 구축할 수 있도록 했습니다[cloud.google +1].
업데이트된 모델은 ComplexFuncBench Audio 벤치마크에서 함수 호출 정확도를 71.5%로, 명령 준수율을 84%에서 90%로 향상시켰으며, 자연스러운 대화 전환, 감정 감지, 시각 데이터 분석과 같은 기능을 포함합니다[cloud.google +1].
United Wholesale Mortgage의 AI 어시스턴트는 2025년 5월 이후 14,000건 이상의 대출을 생성했으며, Shopify [ -0.37%]는 사용자들이 “1분 안에 AI와 대화하고 있다는 사실을 종종 잊는다”고 회사의 제품 담당 부사장이 밝힌 멀티모달 어시스턴트 Sidekick을 개발했습니다[cloud.google +1].
댓글 0