Loading...

AI 뉴스

구글, Gemini Live 어시스턴트에 AR 네비게이션 테스트

페이지 정보

작성자 xtalfi
작성일 09.14 17:21
2 조회
0 추천
0 비추천

본문

ca2d2b123eff6190d7633d4ab639cb25q53h.png

(퍼플렉시티가 정히한 기사)

구글는 구글 지도의 데이터를 카메라 뷰파인더에 직접 통합하여 증강현실 내비게이션 경험을 제공하는 Gemini Live AI 어시스턴트의 혁신적인 업그레이드를 테스트 중이라고 Android Authority가 숨겨진 코드에서 발견했습니다. 최신 구글 앱 베타 버전에서 포착된 이 기능은 사용자가 스마트폰 카메라로 상점, 랜드마크 또는 거리를 비추면 이름, 평점, 리뷰와 같은 정보 카드가 즉시 화면에 오버레이되어 표시됩니다.


이 업그레이드는 8월 Pixel 10 시리즈 출시와 함께 구글이 도입한 시각적 안내 기능을 기반으로 하며, Gemini Live는 화면에 특정 객체를 강조하여 사용자의 업무를 도왔습니다. Android Authority의 테스트에 따르면, 새로운 지도 통합 기능은 카메라 화면에 여러 상점이나 위치가 인식될 경우 동시에 여러 정보 카드를 표시한다고 합니다.


실시간 AR 내비게이션 기능


Google의 기존 Maps 내 Lens 기능과는 달리, 이번 통합 기능은 사용자가 주변 환경에 대해 자연스러운 대화를 나누면서 시각적 데이터 오버레이를 받을 수 있도록 해줍니다. 사용자는 Gemini Live에게 자신이 보고 있는 레스토랑, 상점, 혹은 랜드마크에 대해 질문하면서 동시에 Google Maps 정보가 화면에 표시되는 것을 볼 수 있습니다.


이 기능은 위치 서비스와 독립적으로 작동하며, 주로 시각 인식을 통해 Google의 방대한 Maps 데이터베이스에서 관련 데이터를 불러옵니다. 초기 테스트 결과, 시스템은 카메라 입력만으로도 위치를 식별할 수 있었으나, 위치 서비스를 활성화하면 정확도가 향상될 것으로 보입니다.


Android Authority는 Google 앱 버전 16.35.63 베타에서 이 기능을 성공적으로 활성화했으며, 사업장 이름, 종류, 평균 평점, 리뷰 수 등이 표시되는 정보 카드가 잘 작동하는 모습을 시연했습니다. 이 구현은 오디오 전용 모드에서도 작동하므로, 사용자는 카메라 뷰파인더를 사용하지 않고도 특정 위치 정보를 요청할 수 있습니다.


스마트 안경 통합 전망


업계 분석가들은 이번 개발을 스마트 글래스 통합을 위한 준비 단계로 보고 있습니다. 특히 삼성은 9월 29일 Unpacked 행사에서 Galaxy Glasses를 공개할 계획인 것으로 전해지고 있습니다. AR 스타일 오버레이 기술을 통해 사용자는 비즈니스 정보와 길 안내가 담긴 플로팅 정보 카드를 시야 내에서 바로 볼 수 있게 됩니다.


이번 일정은 구글이 삼성, 퀄컴과 협력해 발표한 안드로이드 XR 이니셔티브와도 맞물립니다. 이들 기업은 안드로이드 XR 기반 XR 헤드셋과 스마트 글래스를 개발하고 있으며, 삼성의 오디오 중심 Galaxy Glasses는 메타의 Ray-Ban 스마트 글래스와 직접 경쟁할 것으로 예상됩니다.


구글은 아직 지도 통합 기능의 공식 출시 일정을 발표하지 않았으나, 관련 코드 인프라는 이미 베타 버전에 적용된 상태입니다. 회사는 최근 업데이트를 통해 Calendar, Keep, Tasks와의 통합 및 Google Maps 기능 강화 등 Gemini Live의 역량을 지속적으로 확대해 나가고 있습니다.

댓글 0
전체 186 / 6 페이지
(퍼플렉시티가 정리한 기사)마이크로소프트(Microsoft)는 Office 365 애플리케이션에 앤트로픽(Anthropic)의 인공지능 기술을 통합하고 있으며, 이는 오픈AI(OpenAI) 모델에만 의존하던 전략에서 벗어난 새로운 움직임입니다. 오늘 The Information에 보도된 바에 따르면, 이번 파트너십을 통해 두 회사의 기술이 마이크로소프트의 생산성 제품군 내에서 함께 작동할 예정이며, 개발자들은 앤트로픽의 최신 모델이 특정 자동화 작업에서 오픈AI를 능가할 수도 있다고 언급하고 있습니다.Anthropic 모델은 사무 작업에서 뛰어난 성과를 보입니다.Anthropic의 기술을 도입하기로 한 결정은 AI 기업의 최신 모델들, 특히 Claude Sonnet 4가 특정 Office 365 기능 자동화에서 우수한 성능을 보인 테스트 결과에 따른 것입니다. Microsoft의 생산성 앱용 AI 기능 개발에 참여한 개발자들은 Anthropic의 모델들이 특히 Excel에서의 재무 계산 실행 및 특정 지시 사항에 따른 PowerPoint 프레젠테이션 생성에서 뛰어남을 발견했습니다.이번 협력은 Microsoft가 Office 365의 AI 역량을 위해 이전까지 독점적으로 의존하던 OpenAI 기술에서 처음으로 의미 있는 전환을 시도하는 것입니다. 수년간 OpenAI의 모델이 Word, Excel, Outlook, PowerPoint 전반의 Copilot 기능을 구동해왔으나, 이제 회사는 AI 포트폴리오를 다각화하여 여러 공급업체를 포함시키고 있습니다.파트너십 갈등 속에서의 전략적 전환이 같은 상황은 마이크로소프트와 오픈AI 간의 관계에 대한 압력이 점점 커지고 있는 가운데 벌어지고 있습니다. 소프트웨어 거대 기업인 마이크로소프트는 2019년 이후 오픈AI에 130억 달러 이상을 투자했지만, 양사의 파트너십 계약은 2030년에 만료될 예정입니다. 최근 협상에서는 지분율, 수익 분배 방식, 독점적 권리 등에 초점이 맞춰졌으며, 오픈AI는 현재 20%인 마이크로소프트의 수익 지분을 줄이고자 하는 것으로 알려졌습니다.마이크로소프트는 자체 AI 모델인 MAI도 개발해왔으며, 이 모델들은 오픈AI와 Anthropic의 주요 모델과 비슷한 성능을 보이고 있습니다. 마이크로소프트는 8월에 MAI-Voice-1과 MAI-1-preview를 선보였는데, 이는 회사의 최초의 엔드투엔드 기반 모델로, 외부 AI 공급업체에 대한 의존도를 줄이려는 더 넓은 전략을 나타냅니다.AI 모델 포트폴리오 확장Anthropic의 통합은 Microsoft가 OpenAI를 넘어 인공지능 역량을 다양화하려는 광범위한 노력의 일부입니다. 이 회사는 Copilot 프레임워크 내에서 성능을 평가하기 위해 DeepSeek, Meta, xAI를 포함한 다양한 업체의 AI 모델을 테스트해 왔습니다. 이러한 다중 모델 접근법은 Microsoft가 다양한 비즈니스 분야에 맞춤형 솔루션을 제공하면서 단일 AI 공급업체에 대한 의존도를 줄일 수 있게 해줍니다.현재 Microsoft와 OpenAI의 파트너십은 OpenAI 모델을 자사 제품 및 클라우드 인프라에 통합할 독점 권한을 포함합니다. 하지만 최근 변경으로 인해 OpenAI의 Azure 독점권이 수정되어, Microsoft가 용량 요구를 충족하지 못할 경우 OpenAI가 다른 클라우드 공급자를 사용할 수 있는 '선매권(right of first refusal)' 모델로 전환되었습니다.Anthropic 기술의 Office 365 통합은 기업용 AI 환경이 변화하고 있음을 보여줍니다. 기업들은 점점 단일 공급업체 솔루션 대신, 유연성과 성능 최적화를 추구하고 있습니다. Microsoft와 Anthropic 모두 The Information의 보도 당시 파트너십 세부 사항에 대한 공식 입장을 내놓지 않았습니다.
68 조회
0 추천
09.11 등록
(퍼플렉시티가 정리한 기사)Google은 Android, iOS, 웹 플랫폼 전반에서 Gemini AI 앱에 오디오 파일 업로드 기능을 추가하여 사용자들의 압도적인 수요에 응답했습니다. Google Labs 및 Gemini 부사장 Josh Woodward는 오디오 지원이 앱 출시 이후 사용자들이 요청한 "가장 많은 요청"이었다고 X에서 발표했습니다.이 기능을 통해 사용자는 MP3, WAV, M4A 등 일반적인 오디오 파일 형식을 앱의 업로드 인터페이스를 통해 직접 업로드할 수 있습니다. 무료 사용자는 하루 5번의 프롬프트로 총 10분 길이의 오디오를 처리할 수 있으며, Google AI Pro 또는 AI Ultra 플랜 구독자는 최대 3시간 분량의 오디오 업로드로 훨씬 더 많은 용량을 제공받습니다.멀티모달 AI 역량 확장이 오디오 기능은 사용자가 Gemini와 상호작용하는 방식을 변화시키며, 인터뷰를 기록하거나 음성 메모를 분석하고 강의 녹음을 검색 가능한 콘텐츠로 변환하는 등 새로운 사용 사례를 가능하게 합니다. 사용자는 이제 회의 녹음을 업로드하여 실행 항목이 포함된 요약을 요청하거나 대학 강의를 제출해 학습 가이드 생성을 요청할 수 있습니다.이번 업데이트는 Gemini를 수개월 전부터 오디오 업로드 기능을 지원해 온 OpenAI의 ChatGPT와 같은 경쟁업체들과 기능적 균형에 더 가까워지게 합니다. Android Police에 따르면, 올해 초 파일 업로드가 제공된 이후로 오디오 지원이 없었던 것은 "이상한 누락"이었다고 합니다.더 넓어진 제미니 생태계 업데이트오디오 기능과 함께, 구글은 AI 모드 검색 경험을 인도어, 인도네시아어, 일본어, 한국어, 브라질 포르투갈어 등 5개 새로운 언어로 확장했습니다. 이번 확장에서는 Gemini 2.5 기술의 맞춤형 버전을 활용하여 단순 번역을 넘어 문화적으로 적합한 답변을 제공합니다.구글은 또한 NotebookLM 연구 보조 도구를 80개 이상의 언어에서 사용자 맞춤형 보고서 형식을 지원하도록 업그레이드하여, 사용자가 업로드한 자료로부터 학습 가이드, 요약 문서, 블로그 글, 퀴즈 등을 생성할 수 있도록 했습니다. 이제 이 플랫폼은 사용자의 선호도에 따라 특정 구조, 스타일, 톤으로 보고서를 작성할 수 있습니다.오디오 업로드 기능은 빠르게 진화하는 인공지능 분야에서 멀티모달 기능의 중요성이 커지고 있는 가운데 구글이 자사의 AI 도구를 더욱 다양하고 경쟁력 있게 만들기 위한 지속적인 노력을 보여줍니다. 이러한 기능은 사용자 참여와 생산성 향상에 중요하게 작용합니다.
68 조회
0 추천
09.11 등록
KBS가 만든 다큐 'AI 시대, 인간의 일'모든 산업에 AI가 혁명적으로 도입되는 지금, 일자리 우려가 많습니다.한번 볼만한 내용입니다.요약- AI 도입이 빠르게 확산: 자동차 공장과 물류창고 등 생산현장에 AI 기반 로봇과 휴머노이드가 투입되어, 인간의 일자리가 줄어들고 있음.- AI는 인간 능력의 '증폭기': 한 사람이 AI를 활용해 여러 업무(시장조사, 코딩, 광고제작 등)를 동시에 처리할 수 있게 되면서 직급, 부서의 의미가 약해지고 신입채용도 감소.- AI의 문제해결 능력: 의료영상 판독, 축산·물류관리 등 데이터가 충분한 분야에서 AI가 빠르고 정확한 해법을 제시. 생성형 AI는 영상 제작 등 창작 과정 자체를 혁신.- 일자리 위기와 해법도 AI: AI 활용 능력이 곧 생존력이 되면서, AI를 잘 활용하는 개인과 기업만이 살아남음. 국가 차원에서도 'AI 주권'과 세계 2위 전략의 필요성 강조.
59 조회
0 추천
09.10 등록
Anthropic의 Claude AI가 채팅창에서 직접 PDF, 파워포인트 슬라이드, 엑셀 스프레드시트, 워드 문서를 생성하고 편집할 수 있는 새로운 기능을 9일 출시했다.이 기능은 사용자가 필요한 파일을 설명하고 관련 데이터를 업로드하면 Claude가 개인용 컴퓨터 환경에서 코드를 작성해 즉시 사용 가능한 파일을 생성해준다. 파일 생성 기능은 현재 Max(월 100달러, 약 13만 8,500원), Team, Enterprise 플랜 사용자에게 프리뷰로 제공되며, Pro 사용자는 몇 주 내에 접근할 수 있게 된다. PDF 보고서를 파워포인트 슬라이드로 변환하거나 원시 데이터를 차트와 통계 분석이 포함된 완성된 문서로 변환하는 등 포맷 간 작업도 지원한다.사용자는 설정에서 "업그레이드된 파일 생성 및 분석" 기능을 활성화한 후 완성된 문서를 다운로드하거나 구글 드라이브에 직접 저장할 수 있다.
70 조회
0 추천
09.10 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입