Loading...

AI 뉴스

구글, 제미나이 어시스턴트용 마이크 잠금 기능 테스트

페이지 정보

작성자 xtalfi
작성일 2025.10.23 03:36
2,065 조회
0 추천
0 비추천

본문

5391be9aff9dbd0f8fbd579e4a31cfd5EJtM.jpg

(퍼플렉시티가 정리한 기사)

Google는 사용자들이 음성 명령을 사용할 때 가장 큰 불만 중 하나인 생각하느라 잠시 멈췄을 때 말이 중간에 끊기는 문제를 해결할 수 있는 혁신적인 마이크 잠금 기능을 Gemini AI 어시스턴트에 테스트하고 있습니다. 최근 코드 분석을 통해 Google 앱 버전 16.42.61에서 발견된 이 기능은 사용자가 시간 제한 없이 확장된 음성 상호작용을 위해 마이크를 열어둘 수 있게 해줍니다.​

새로운 기능은 WhatsApp의 음성 메모 잠금 메커니즘과 유사하게 작동하며, 사용자가 Gemini의 입력창에서 마이크 아이콘을 길게 눌러 수동으로 중지할 때까지 계속 듣도록 할 수 있습니다. 활성화되면 마이크 아이콘이 정지 버튼으로 변환되어 사용자가 말을 마쳤을 때 탭할 수 있으며, 서두르지 않고 복잡한 질문을 표현할 수 있는 무제한 시간을 제공합니다.

 

사용자 불편 사항 해결

 

마이크 잠금 기능은 길고 신중한 요청을 하는 도중 반복적으로 끊기는 문제를 겪는 AI 음성 비서 사용자들의 지속적인 불만을 해결합니다. 현재 Gemini의 표준 음성 모드를 포함한 대부분의 AI 비서는 짧은 멈춤을 대화 종료 지점으로 해석하고 조기에 응답 처리를 시작합니다.​

"현재 음성 비서의 과제 중 하나는 사용해보셨다면 특정 키워드로 학습되어 있거나 억양을 잘 이해하지 못하기 때문에 좌절감을 느끼셨을 것입니다"라고 General Motors의 Dave Richardson이 대화형 AI 개선에 관한 최근 인터뷰에서 설명했습니다.​

잠금 마이크 기능은 특히 타이핑보다 음성으로 질의하는 것을 선호하는 사용자들을 대상으로 하며, 특히 숙고를 위한 멈춤이 필요한 복잡하고 다단계적인 요청에 유용합니다. 이 개선 사항은 Gemini를 다양한 속도로 말하거나 문구 사이에 시간이 필요한 사용자들에게 더욱 접근하기 쉽게 만듭니다.

 

추가 인터페이스 개선

 

마이크 잠금 기능과 함께 Google은 여러 다른 Gemini 인터페이스 개선 사항을 테스트하고 있습니다. 이제 플로팅 입력 상자는 사용자가 타이핑을 시작할 때 확장되어 Gemini의 전용 Android 인터페이스 디자인을 반영합니다. 또한 이동 가능한 Gemini Live 오버레이 버튼을 통해 사용자는 화면의 6개 위치(왼쪽 또는 오른쪽의 상단, 중앙 또는 하단)에 배치할 수 있어 앱 콘텐츠를 가리지 않으면서 유연성을 제공합니다.​

Google은 또한 동일한 앱 버전에서 발견된 Gemini Live 대화용 음소거 버튼을 별도로 개발하고 있습니다. 이 기능은 현재의 일시 중지/재개 버튼을 대체하며, 사용자가 Gemini의 응답을 계속 들으면서 마이크를 음소거할 수 있게 하여 배경 소음이 대화를 방해할 수 있는 시끄러운 환경에서 특히 유용합니다.​

이러한 기능들은 아직 초기 테스트 단계에 있으며 APK 분해의 실험적 특성에서 알 수 있듯이 공개 출시에 도달하지 않을 수도 있습니다. 그러나 이러한 발견은 자연스러운 음성 상호작용을 개선하고 Gemini를 지속적이고 복잡한 쿼리에 대해 더 대화적이고 사용자 친화적으로 만들려는 Google의 의지를 시사합니다.

댓글 0
전체 1,366 / 89 페이지
Microsoft는 파일 정리 및 이메일 전송과 같은 작업을 자동화하도록 설계된 새로운 Copilot Actions AI 기능이 장치를 손상시키고 민감한 데이터를 훔칠 수 있다는 경고를 발표했으며, 이는 빅테크 기업들이 보안 위험을 완전히 이해하기 전에 기능을 출시한다는 비판을 다시 불러일으켰습니다.회사는 특히 공격자가 웹사이트, 이력서 또는 이메일에 악의적인 명령을 삽입할 수 있는 프롬프트 인젝션 취약점에 대해 사용자들에게 경고했으며, 대규모 언어 모델은 이를 정당한 사용자 지시와 구별할 수 없습니다.Open Worldwide Application Security Project는 2025년 LLM 애플리케이션 상위 10대 보안 위험에서 프롬프트 인젝션을 1위 보안 위험으로 선정했으며, 이는 AI 에이전트가 제어 명령과 사용자 데이터를 구분하지 못하는 근본적인 무능력에 대한 업계 전반의 우려를 반영합니다.
1225 조회
0 추천
2025.11.20 등록
Micropolis Holding Co.는 11월 18일 NVIDIA Orin SOC를 탑재한 IP67 등급의 엣지 컴퓨팅 유닛을 출시하여 클라우드 연결 없이도 감시, 객체 감지 및 행동 분석을 위한 온디바이스 AI 처리를 가능하게 했습니다.8GB에서 64GB 구성으로 제공되는 이 견고한 장치는 법 집행, 국경 통제 및 국가 안보 임무를 위해 설계되었으며, 여러 로봇과 센서에 걸쳐 분산 엣지 네트워크로 작동할 수 있습니다[‘.CEO Fareed Aljawhari는 이러한 통합을 통해 Microspot이 “복잡한 AI 모델을 현장에서 즉시 안전하게 처리”할 수 있게 되어, 신뢰성이 타협될 수 없는 중요한 작전에서 실시간 의사결정을 지원한다고 말했습니다.
1224 조회
0 추천
2025.11.20 등록
1950~60년대 미니컴퓨터 붐은 혁신적 반도체 기술의 발전과 소형화 바람을 타고 수많은 신생 기업과 투자 자본이 단일 산업으로 몰렸던 시기였다. 기업들은 앞다투어 성장했지만, 대부분은 처절한 실패로 끝났고 수십억 달러의 손실이 발생하면서 시장이 한 차례 정리되었다. 이 과정에서 궁극적으로 몇몇 상장기업이 20년 가까운 세월 동안 살아남아 산업을 대표하게 되었다.오늘날 AI 붐 역시 유사하게 폭발적 자본 유입과 스타트업 창업이 반복되고 있다. 하지만 과거와 달리 주요 AI 기업들은 IPO(상장) 대신 비상장 상태에서 거대 자본을 유치하며 급격한 가치 상승을 경험 중이다. 그 결과 일반 투자자들은 직접 투자할 기회가 적고, 기업가치 역시 6~9개월마다 두 배 가까이 오르는 등 민간 시장 중심의 과열 양상을 보인다.Commoncog는 단기 버블 여부를 논하기보다는, 기술 산업에서 반복되는 진입-도태 메커니즘과 시간이 걸리더라도 결국 산업 구조가 단단해지는 과정을 주목해야 한다고 강조한다. 미니컴퓨터 붐처럼, AI 붐도 필연적으로 실패와 도태, 점진적 구조 변화를 거치며 장기적으로는 견고한 성장 기반을 남길 것이라는 점이 반복적으로 제시된다.
1247 조회
0 추천
2025.11.20 등록
MIT는 신경 활동이 주관적 의식 경험을 만들어내는 이유를 과학적으로 탐구하기 위해 MIT 의식 클럽을 출범시켰으며, 철학자 Matthias Michel과 신경과학자 Earl Miller를 한자리에 모아 철학과 인지신경과학을 연결하고 있다.이 이니셔티브는 뇌가 의식적 시각 시스템과 무의식적 시각 시스템이라는 두 가지 시각 시스템으로 작동한다는 발견을 바탕으로, 자극 제시와 의식적 인식 사이의 시간 지연을 측정하는 것과 같은 근본적인 질문들을 탐구한다의식 메커니즘에 대한 이해는 고령 환자의 수술 치료를 개선할 수 있으며, 이들 중 최대 10%가 전신 마취를 동반한 비심장 수술 후 장기적인 인지 기능 저하를 경험한다.
1223 조회
0 추천
2025.11.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입