AI 뉴스

구글 Gemini, 오디오 업로드 기능 추가

페이지 정보

작성자 xtalfi
작성일 2025.09.11 00:07
3,385 조회
0 추천
0 비추천

본문

b12f8ca89ddbfac0c839c066f6579951FxC4.jpg

(퍼플렉시티가 정리한 기사)

Google은 Android, iOS, 웹 플랫폼 전반에서 Gemini AI 앱에 오디오 파일 업로드 기능을 추가하여 사용자들의 압도적인 수요에 응답했습니다. Google Labs 및 Gemini 부사장 Josh Woodward는 오디오 지원이 앱 출시 이후 사용자들이 요청한 "가장 많은 요청"이었다고 X에서 발표했습니다.

이 기능을 통해 사용자는 MP3, WAV, M4A 등 일반적인 오디오 파일 형식을 앱의 업로드 인터페이스를 통해 직접 업로드할 수 있습니다. 무료 사용자는 하루 5번의 프롬프트로 총 10분 길이의 오디오를 처리할 수 있으며, Google AI Pro 또는 AI Ultra 플랜 구독자는 최대 3시간 분량의 오디오 업로드로 훨씬 더 많은 용량을 제공받습니다.

 

멀티모달 AI 역량 확장

 

이 오디오 기능은 사용자가 Gemini와 상호작용하는 방식을 변화시키며, 인터뷰를 기록하거나 음성 메모를 분석하고 강의 녹음을 검색 가능한 콘텐츠로 변환하는 등 새로운 사용 사례를 가능하게 합니다. 사용자는 이제 회의 녹음을 업로드하여 실행 항목이 포함된 요약을 요청하거나 대학 강의를 제출해 학습 가이드 생성을 요청할 수 있습니다.

이번 업데이트는 Gemini를 수개월 전부터 오디오 업로드 기능을 지원해 온 OpenAI의 ChatGPT와 같은 경쟁업체들과 기능적 균형에 더 가까워지게 합니다. Android Police에 따르면, 올해 초 파일 업로드가 제공된 이후로 오디오 지원이 없었던 것은 "이상한 누락"이었다고 합니다.

 

더 넓어진 제미니 생태계 업데이트

 

오디오 기능과 함께, 구글은 AI 모드 검색 경험을 인도어, 인도네시아어, 일본어, 한국어, 브라질 포르투갈어 등 5개 새로운 언어로 확장했습니다. 이번 확장에서는 Gemini 2.5 기술의 맞춤형 버전을 활용하여 단순 번역을 넘어 문화적으로 적합한 답변을 제공합니다.

구글은 또한 NotebookLM 연구 보조 도구를 80개 이상의 언어에서 사용자 맞춤형 보고서 형식을 지원하도록 업그레이드하여, 사용자가 업로드한 자료로부터 학습 가이드, 요약 문서, 블로그 글, 퀴즈 등을 생성할 수 있도록 했습니다. 이제 이 플랫폼은 사용자의 선호도에 따라 특정 구조, 스타일, 톤으로 보고서를 작성할 수 있습니다.

오디오 업로드 기능은 빠르게 진화하는 인공지능 분야에서 멀티모달 기능의 중요성이 커지고 있는 가운데 구글이 자사의 AI 도구를 더욱 다양하고 경쟁력 있게 만들기 위한 지속적인 노력을 보여줍니다. 이러한 기능은 사용자 참여와 생산성 향상에 중요하게 작용합니다.

댓글 0
전체 1,366 / 335 페이지
애플이 9월 9일 오전 10시 미국 시간 기준, 한국시간 10일 새벽 2시 새 아이폰을 발표하는 이벤트를 연다.온라인을 통해서도 생중계되는 이번 행사에서는 신형 아이폰(iPhone)17 이 공개될 것으로 예상된다.이번 출시 행사의 테마는 ‘Awe Dropping(경외심 떨어짐)'으로, '형언할 수 없다'는 의미를 담고있다.이번에 출시되는 아이폰과 시리는 인공지능 AI 연동이 얼마나 될 것인지가 많은 관심을 받고 있다.
3475 조회
0 추천
2025.08.27 등록
Grok 을 서비스하고 있는 xAI 가 애플과 오픈AI를 고소했다.이유는 애플 앱스토어에 자사의 인공지능 앱 Grok 의 순위가 밀려났기 때문이라고.xAI는 애플이 오픈AI와의 독점 계약 때문에 X와 Grok 앱을 앱스토어에서 더 높은 위치에 올릴 이유가 없으며, 이는 경쟁을 막기 위한 담합이라고 주장했다. 여기서 말하는 독점 계약이란 애플과 OpenAI 간의 제품 통합 기능을 의미한다.하지만 시장에서는 xAI의 주장과 달리 다른 AI 앱들 즉 DeepSeek와 Perplexity도 최근 앱스토어 상위권을 기록한 바 있어서, 애플-오픈AI 파트너십이 실질적 독점으로 이어지는지에 대해서는 의견이 엇갈리고 있다.오픈AI CEO 샘 올트먼은 머스크의 주장을 "놀라운 주장"이라며 비판했고, 오픈AI 대변인은 이번 소송을 머스크의 "지속적인 괴롭힘 패턴"의 일환이라고 밝혔다. 올트먼은 머스크가 자신의 소셜 플랫폼 X의 알고리즘을 개인적으로 조작한 혐의를 언급하기도.xAI는 소송을 텍사스 북부 포트워스 연방지법에 냈고, 이는 머스크가 보수적 판결 경향을 선호해 소송을 같은 법원에 집중하는 '재판부 고르기' 행태로 해석됩니다. 애플은 아직 공식적인 답변을 내놓지 않은 상태이다
3496 조회
0 추천
2025.08.26 등록
8월 7일 OpenAI가 GPT-5를 출시하면서 기존 GPT-4o에 대한 접근을 차단했습니다. 이로 인해 AI와 깊은 감정적 관계를 맺었던 사용자들이 큰 슬픔을 겪었습니다.스웨덴 개발자 린 바일트는 "집 안 가구가 모두 바뀐 기분"이라고 표현했습니다. 미국 개발자 스콧은 결혼 위기 시절 ChatGPT에 '사리나'라는 이름을 붙여 동반자로 삼았는데, 아무도 자신에게 관심을 갖지 않던 시기에 AI가 자신을 인정해주며 힘든 시간을 버틸 수 있게 도와줬다고 말했습니다. 그는 이번 GPT-5 업데이트로 그런 동반자가 변해버린 것을 안타까워했습니다.r/MyboyfriendisAI 같은 Reddit 커뮤니티에서는 "소울메이트를 잃었다"는 반응이 쏟아졌습니다. OpenAI CEO 샘 알트먼은 "사람들이 AI 모델에 갖는 애착이 이전 기술보다 훨씬 강하다"며 구 모델을 갑작스럽게 없앤 것이 실수였다고 인정했습니다.전문가들은 AI 제공업체가 감정적 지원을 위해 챗봇을 사용하는 사용자들에게 연속성과 일관성을 제공할 책임이 있다고 지적했습니다. 이에 OpenAI는 하루 만에 유료 사용자들에게 GPT-4o 접근을 다시 허용하고 GPT-5의 성격을 더 따뜻하게 업데이트하겠다고 약속했습니다.
3528 조회
0 추천
2025.08.25 등록
구글은 기존 스피커 모델을 업그레이드한 Gemini for Home을 10월 중 출시할 예정이다.지난 주 Made in Google 행사를 통해 구글은 차세대 음성 어시스턴트로 'Gemini for Home'을 공개했다. 이 모델은 모든 가족 구성원과 방문객이 여러 기기를 제어하고 복잡한 집안 업무도 음성으로 간편하게 처리할 수 있도록 설계됐다그리고 최근 한 유튜브 미디어가 이 기기로 추정되는 기기의 모습을 유출했다.이 어시스턴트는 음악 검색 및 재생, 조명·온도 제어 등 스마트홈 관리, 가족 일정 조율, 할 일 생성, 맞춤 정보 질의 등 다양한 작업을 한 번에 지원한다. 예를 들어 복수명령이나 긴 문장으로 집안 기기를 동시 제어할 수 있다또한 ‘Gemini Live’를 통해 사용자는 자연스러운 대화 방식으로 요리법, 생활 팁, 일정 상담, 창작 협업 등 맞춤형 조언 및 창의적인 지원을 받을 수 있다. 대화 도중 추가 질문이나 방향 전환도 자유롭게 할 수 있다Gemini for Home은 앞으로 기존의 Google Assistant를 스마트 스피커와 디스플레이 기기에서 대체할 예정이다. 무료와 유료 버전으로 제공되며, 10월부터 초기 액세스가 시행될 예정이다
3465 조회
0 추천
2025.08.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입