Loading...

AI 뉴스

마이크로소프트, 윈도우 11에 음성 제어 및 AI 에이전트 추가

페이지 정보

작성자 xtalfi
작성일 2025.10.17 15:39
504 조회
0 추천
0 비추천

본문

028ba93a8cbca0a75ca4fdeb79779fd2ZXxr.jpg

(퍼플렉시티가 정리한 기사)

Microsoft는 오늘 Windows 11에 대한 주요 인공지능 업그레이드를 공식 출시하며, Copilot 어시스턴트를 통한 음성 제어 기능과 자율 작업 관리 기능을 도입했습니다. 이는 Windows 10에 대한 지원 종료 시점에 맞춰 전략적으로 계획된 것입니다.

회사는 사용자들이 이제 "Hey, Copilot"이라고 말하여 Copilot을 활성화할 수 있으며, 이를 통해 모든 Windows 11 디바이스에서 AI 어시스턴트와 핸즈프리 상호작용이 가능하다고 발표했습니다. 이는 Microsoft가 운영 체제에 AI를 직접 통합하기 위한 가장 적극적인 시도로, 회사가 "모든 Windows 11 PC"를 AI 지원 머신으로 전환한다고 표현한 바 있습니다.

 

음성 명령과 화면 분석이 새로운 기능을 주도합니다

 

오늘 업데이트의 핵심은 사용자가 "Hey, Copilot"이라는 호출 문구를 사용하여 컴퓨터와 자연스러운 대화를 나눌 수 있게 해주는 Copilot Voice입니다. 이 기능은 현재 전 세계적으로 이용 가능한 Copilot Vision과 짝을 이루며, 사용자 화면에 표시된 콘텐츠를 분석하고 상황에 맞는 지원을 제공할 수 있습니다.​

Microsoft의 소비자 부문 부사장 겸 최고 마케팅 책임자인 Yusuf Mehdi는 "우리는 AI가 챗봇에 국한되지 않고 사람들이 매일 접하는 수많은 경험에 완벽하게 통합되는 다음 단계의 문턱에 서 있다고 믿습니다"라고 말했습니다.​

Microsoft는 사용자가 Copilot에게 Spotify 오디오 품질 설정을 개선하거나 화면에 표시된 포트폴리오 콘텐츠를 기반으로 약력을 작성하도록 요청하는 모습을 보여주는 홍보 자료를 통해 이 기술의 기능을 시연했습니다. 회사는 모든 상호작용이 사용자 동의를 필요로 하며 "Goodbye"라고 말하거나 수동 제어를 통해 종료할 수 있다고 강조했습니다.

 

복잡한 작업을 수행하는 실험적 AI 에이전트

 

아마도 가장 야심찬 추가 기능은 Copilot Actions일 것입니다. 이는 현재 Windows Insiders를 대상으로 테스트 중인 실험적 기능으로, AI 에이전트가 사용자의 컴퓨터에서 실제 작업을 수행할 수 있게 합니다. 이 기능은 사진을 정리하고, PDF에서 데이터를 추출하며, 이메일을 보내고, 심지어 데스크톱 및 웹 애플리케이션과 상호작용할 수도 있습니다.​

이러한 AI 에이전트는 보안 경계를 유지하기 위해 사용자 계정과 분리된 자체 데스크톱 환경을 가진 격리된 "작업 공간" 내에서 작동합니다. Microsoft는 이 기능이 제한된 권한으로 시작되며 각 작업마다 명시적인 사용자 동의가 필요하다고 강조했습니다.​

회사는 이전에 발표한 Recall 기능에 대한 비판 이후 더욱 신중한 접근 방식을 취하고 있습니다. 이 기능은 개인정보 보호 우려에 직면하여 지연되었습니다. Microsoft는 "우리는 이러한 통찰력을 새로운 개발에 내재화했습니다"라고 밝히며 투명성과 사용자 제어를 강조했습니다.

 

Windows 10 전환 과정에서의 전략적 타이밍

 

이러한 AI 개선 사항은 마이크로소프트가 10월 14일 Windows 10에 대한 무료 지원을 종료한 지 불과 이틀 만에 도입되었으며, 이는 10년 된 시스템을 여전히 사용 중인 Windows 데스크톱 사용자의 약 40%에 영향을 미칩니다. 이 시기는 Windows 11로의 업그레이드를 유도하기 위해 계획된 것으로 보이며, 마이크로소프트는 "대화할 수 있는 컴퓨터를 만나보세요"라는 슬로건을 홍보하는 텔레비전 광고를 시작했습니다.​

Windows 10을 계속 사용하는 사용자는 2026년까지 연간 30달러에 확장 보안 업데이트를 구매할 수 있지만, EU 거주자는 Microsoft 계정으로 이러한 업데이트를 무료로 받을 수 있습니다. 마이크로소프트는 또한 PC 설정을 OneDrive에 동기화하거나 1,000 Microsoft Rewards 포인트를 사용하는 미국 사용자에게 무료 ESU 액세스를 제공하고 있습니다.​

회사는 이러한 새로운 Copilot 기능이 "AI를 중심으로 운영 체제를 완전히 재구상"하려는 비전을 나타내며, 경영진이 "진정한 AI PC"라고 설명하는 것을 만들어낸다고 밝혔습니다. 40+ TOPS 신경 처리 장치가 있는 특수 하드웨어를 필요로 했던 이전 Copilot+ PC 지정과 달리, 이러한 새로운 기능은 모든 Windows 11 장치에서 작동합니다.

댓글 0
전체 827 / 102 페이지
(퍼플렉시티가 정리한 기사)Google는 사용자들에게 "우리의 가장 똑똑한 모델인 Gemini 3.0 Pro로 이동되었습니다"라는 업그레이드 알림을 표시하기 시작했으며, 이는 회사의 차세대 AI 모델의 공개 출시가 임박했음을 시사합니다. 화요일 사용자들에 의해 발견된 이 알림은 Google의 주요 제품 웹사이트에서 Gemini 3.0 Pro에 대한 첫 공식 인정을 나타냅니다.​주요 Gemini 인터페이스에 업그레이드 문구가 나타난 것은 Google의 출시 전략에서 중요한 이정표를 나타내며, 회사가 내부 테스트 단계를 넘어 일반 사용 가능성을 향해 나아갔음을 시사합니다. 이러한 개발은 Google AI Studio를 통해 수행된 수 주간의 A/B 테스트에 이어진 것으로, 선별된 사용자들이 듀얼 모델 카드가 나타날 때까지 프롬프트를 반복적으로 제출하여 Gemini 3.0 Pro에 액세스할 수 있었습니다.초기 테스트에서 향상된 성능초기 테스터들은 Gemini 3.0 Pro의 코딩 능력, 특히 SVG 생성 및 프론트엔드 개발과 같은 복잡한 작업에서 상당한 개선을 보고하고 있습니다. 벤치마크 비교에서 이 모델은 이전 버전인 Gemini 2.5 Pro와 Anthropic의 Claude 4.5 Sonnet과 같은 경쟁 모델 모두보다 우수한 성능을 보여주었습니다. AI Studio를 통해 모델을 테스트한 개발자들은 더 빠른 응답 시간과 더 정확한 코드 생성을 언급했으며, 일부는 단일 프롬프트로 완전한 웹 애플리케이션을 생성했다고 보고했습니다.​​이 모델은 멀티모달 작업에서 탁월한 성능을 보이며, 텍스트, 이미지 및 코드를 동시에 처리하는 향상된 능력을 보여줍니다. Google은 또한 AI Studio에서 생성된 결과물을 위한 갤러리 역할을 하는 "My Stuff" 기능을 포함한 UI 개선 사항을 구현했습니다.10월 런칭 예상ㅊGoogle이 공식적으로 출시일을 확인하지는 않았지만, 유출된 내부 문서에 따르면 이르면 10월 22일에 발표가 있을 수 있다고 합니다. 소셜 미디어 플랫폼에 유출된 타임라인에는 해당 날짜에 대한 "Gemini 3.0 출시 시점(마케팅 마일스톤)"이라는 표기가 포함되어 있습니다.​이 시기는 주요 AI 업데이트에 대한 Google의 전형적인 수요일 출시 일정과 일치합니다. 업계 관찰자들은 Gemini 메인 웹사이트에 공식 업그레이드 공지가 나타나는 것이 일반적으로 공개 출시보다 몇 주가 아닌 며칠 앞서 이루어진다고 지적합니다.​Google의 Gemini 3.0 Pro는 OpenAI의 곧 출시될 모델들과 직접 경쟁할 것으로 예상되며, ChatGPT의 시장 지배력에 도전하려는 회사의 지속적인 노력을 나타냅니다. 이 모델의 향상된 코딩 기능과 멀티모달 개선은 Workspace 통합을 통해 Google의 AI 제품을 테스트해 온 개발자와 기업 사용자들에게 중요한 업그레이드로 자리매김하고 있습니다.
563 조회
0 추천
2025.10.16 등록
(퍼플렉시티가 정리한 기사)Pew Research Center가 오늘 발표한 연구에 따르면, 25개국을 대상으로 한 광범위한 새로운 조사에서 전 세계 대부분의 성인들이 인공지능을 인지하고 있지만, 일상생활에서 그 역할이 증가하는 것에 대해 흥분보다는 훨씬 더 많은 우려를 품고 있는 것으로 나타났다.​2025년 1월부터 4월까지 유럽에서 사하라 이남 아프리카에 이르는 지역에 걸쳐 실시된 이 연구는 전 세계적으로 성인의 34%가 AI의 사용 증가에 대해 흥분보다 더 우려하고 있으며, 단 16%만이 우려보다 더 많은 흥분을 표현한다는 것을 발견했다. 가장 큰 그룹인 42%는 이 기술에 대해 우려와 흥분을 동등하게 느낀다고 보고했다.광범위한 인식, 지속적인 경계우려에도 불구하고, AI 인식은 전 세계적으로 상당한 수준에 도달했으며, 성인의 81%가 인공지능에 대해 최소한 어느 정도는 들어본 적이 있다고 답했습니다. 그러나 AI에 대해 "많이" 들어봤다고 보고한 사람은 34%에 불과했으며, 47%는 "조금" 들어봤고 14%는 전혀 들어본 적이 없다고 답했습니다.​이 조사는 최근 ChatGPT가 주간 사용자 8억 명을 달성했다고 발표한 시점에 이루어졌으며, 대중의 우려 속에서도 AI의 빠른 주류 채택을 보여줍니다. 가장 높은 우려 수준을 보이는 국가로는 미국, 이탈리아, 호주, 브라질, 그리스가 있으며, 이들 국가에서는 성인의 약 절반이 열정보다는 걱정을 더 많이 표현했습니다.디지털 격차와 인구통계연구 결과는 AI 태도에 대한 뚜렷한 인구통계학적 패턴을 보여줍니다. 젊은 성인들은 조사 대상이 된 거의 모든 국가에서 일관되게 더 높은 인식과 열의를 보입니다. 인터넷 사용은 AI에 대한 흥미와 강한 상관관계를 나타내며, "거의 항상" 온라인 상태인 사람들이 가끔 사용하는 사용자들에 비해 AI를 수용할 가능성이 훨씬 더 높습니다.​부(富) 또한 결정적인 역할을 하는데, 고소득 국가의 사람들이 AI에 대해 더 높은 친숙도를 보입니다. 일본은 성인의 53%가 AI에 대해 많이 들어봤다고 응답하며 선두를 차지한 반면, 케냐에서는 단 12%만이 비슷한 수준의 인식을 보고했습니다.신뢰 및 규제 문제이 설문조사는 AI를 효과적으로 규제할 수 있는 다양한 주체들의 능력에 대한 신뢰도가 엇갈린다는 것을 발견했습니다. 대부분의 사람들은 국제기구보다 자국을 더 신뢰하며, 인도인의 89%가 자국의 규제 역량에 대해 신뢰를 표명한 반면 그리스인은 22%에 불과했습니다.​글로벌 규제 기관을 비교할 때, 53%는 유럽연합이 AI를 효과적으로 규제할 것이라고 신뢰하는 반면, 37%는 미국을, 27%는 중국을 신뢰합니다. 이는 EU의 AI 법안이 2025년 8월에 발효되고 여러 국가들이 자체 규제 프레임워크를 시행함에 따라 AI 거버넌스에 대한 국제적 관심이 증가하고 있음을 반영합니다.​이러한 조사 결과는 AI 통합이 전 세계적으로 가속화되는 가운데 대중의 신뢰가 인구통계학적, 지리적 경계를 넘어 분산되어 있어 정책 입안자와 기술 기업들이 직면한 과제를 강조합니다.
574 조회
0 추천
2025.10.16 등록
(퍼플렉시티가 정리한 기사)Google는 수요일에 지금까지 가장 진보된 AI 비디오 생성 모델인 Veo 3.1을 공개했으며, 향상된 오디오 기능, 객체 수준 편집 도구, 세로 비디오 형식 지원을 도입하면서 최근 업데이트된 OpenAI의 Sora 모델과의 경쟁을 강화하고 있습니다.​최신 버전은 5월에 출시되어 Google의 Flow 플랫폼을 통해 이미 2억 7,500만 개 이상의 비디오를 생성한 Veo 3를 크게 발전시킨 것입니다. Veo 3.1은 "더 풍부한 오디오, 더 많은 내러티브 제어, 실제와 같은 질감을 포착하는 향상된 사실감"을 제공하며, 계산 낭비를 줄이는 개선된 프롬프트 준수 기능을 제공합니다.새로운 창의적 기능이 비디오 제작을 혁신하다이 모델은 창작자들에게 AI 생성 콘텐츠에 대한 전례 없는 제어권을 제공하는 획기적인 기능을 도입합니다. 사용자는 이제 "Ingredients to Video" 기능을 통해 여러 참조 이미지를 업로드할 수 있으며, AI가 서로 다른 캐릭터, 객체 및 스타일을 동기화된 오디오와 함께 일관된 장면으로 병합할 수 있습니다.​특히 주목할 만한 추가 기능은 "Insert" 기능으로, 사용자가 자동 조명 및 그림자 조정과 함께 기존 비디오에 새로운 요소를 추가할 수 있습니다. Google은 곧 "Remove" 도구가 출시될 것이라고 약속하며, 이를 통해 원치 않는 객체를 자연스럽게 배경을 재구성하면서 매끄럽게 삭제할 수 있습니다.​현대 콘텐츠 창작자들에게 가장 중요한 점은 Veo 3.1이 이제 가로 16:9와 세로 9:16 화면 비율을 모두 지원하여 소셜 미디어용 콘텐츠에 대한 증가하는 수요를 충족시킨다는 것입니다. 이 모델은 또한 첫 번째와 마지막 프레임 이미지 사이의 전환을 생성하여 기존의 8초 제한을 넘어 1분 이상까지 확장되는 부드러운 내러티브 브리지를 만들 수 있습니다.경쟁 환경이 뜨거워지다이번 출시는 AI 비디오 생성 분야가 구글과 OpenAI 간의 양강 구도로 치열해지는 가운데 이루어졌습니다. 최근 비교 결과에 따르면 엇갈린 평가가 나오고 있으며, 일부 초기 사용자들은 특정 시나리오에서 Sora 2의 뛰어난 현실감을 언급하는 한편, Veo 3.1의 더 긴 생성 기능과 창의적 제어 기능을 칭찬하고 있습니다.​Tom's Guide는 "Sora 2가 AI의 틱톡이라면, Veo 3.1은 넷플릭스"라고 평가하며, 바이럴 준비된 클립보다 영화적 스토리텔링에 중점을 둔 이 모델의 특징을 강조했습니다.​Veo 3.1은 Google Flow, Gemini API, Vertex AI, 그리고 Gemini 앱을 통해 즉시 이용 가능하며, 가격은 이전 버전과 동일하게 표준 모델은 초당 $0.40, Fast 버전은 $0.15입니다. 접근을 위해서는 Google AI Pro 구독이 필요하며, AI 기반 비디오 제작을 도입할 준비가 된 전문 크리에이터와 기업 사용자를 대상으로 포지셔닝되어 있습니다.
551 조회
0 추천
2025.10.16 등록
(퍼플렉시티가 정리한 기사)Anthropic은 수요일에 Claude Haiku 4.5를 공개했습니다. 이는 회사의 Claude Sonnet 4와 비교할 만한 코딩 성능을 제공하면서도 비용은 3분의 1 수준이고 속도는 2배 이상 빠른 컴팩트한 AI 모델입니다. 이번 출시는 고급 AI 기능을 광범위한 배포를 위해 더욱 접근 가능하고 경제적으로 만드는 중요한 진전을 의미합니다.새로운 모델은 모든 사용자에게 즉시 제공되며 무료 Claude.ai 구독자를 위한 기본 옵션이 되었습니다. 이는 Anthropic이 성능과 효율성의 균형을 맞추는 데 있어 획기적인 발전이라고 부르는 것을 나타냅니다. 회사에 따르면, Haiku 4.5는 SWE-bench Verified 코딩 평가에서 73%를 달성했으며, 이는 불과 5개월 전까지만 해도 최첨단으로 여겨졌던 모델의 성능과 일치합니다.실시간 애플리케이션을 위한 비용 효율적인 AIClaude Haiku 4.5는 입력 토큰 100만 개당 1달러, 출력 토큰 100만 개당 5달러로 가격이 책정되어 있으며, 경쟁력 있는 성능을 유지하면서도 대형 모델보다 훨씬 저렴합니다. 비교하자면, Claude Sonnet 4와 4.5는 입력 토큰 100만 개당 3달러, 출력 토큰 100만 개당 15달러입니다.​이 모델은 챗봇, 고객 서비스 에이전트, 페어 프로그래밍 작업을 포함한 지연 시간에 민감한 애플리케이션에서 뛰어난 성능을 발휘합니다. 향상된 속도 덕분에 응답 시간이 중요한 실시간 상호작용에 특히 적합합니다.​Anthropic이 제공한 성명에서 Block Inc의 Brad Axen은 "Haiku 4.5는 지능과 빠른 출력을 모두 가질 수 있다는 것을 증명합니다"라고 말했습니다. "복잡한 워크플로우를 안정적으로 처리하고, 실시간으로 자체 수정하며, 지연 시간 오버헤드 없이 추진력을 유지합니다."다중 에이전트 기능 및 플랫폼 통합Haiku 4.5의 주요 혁신은 다중 에이전트 구성에서 Anthropic의 더 강력한 모델과 함께 작동할 수 있는 능력입니다. Claude Sonnet 4.5는 복잡한 계획과 전략을 처리할 수 있으며, 여러 Haiku 4.5 인스턴스가 하위 작업을 병렬로 실행합니다. 이러한 접근 방식은 코딩, 금융 분석 및 연구 애플리케이션에서 계산 비용을 절감하면서 더 정교한 워크플로우를 가능하게 합니다.​이 모델은 Anthropic의 API, Amazon Bedrock 및 Google Cloud Vertex AI를 통해 사용할 수 있습니다. 또한 Claude Haiku 4.5는 GitHub Copilot에 통합되었으며, 현재 Pro, Business 및 Enterprise 사용자를 위한 공개 프리뷰로 제공되고 있습니다.​GitHub Copilot 사용자는 Visual Studio Code, GitHub.com 및 모바일 플랫폼에서 이 모델에 액세스할 수 있으며, 점진적인 출시가 진행 중입니다. 이 통합은 속도와 비용 효율성이 가장 중요한 개발자 워크플로우로 Haiku 4.5의 도달 범위가 크게 확장되었음을 의미합니다.향상된 안전성 프로필Anthropic은 Claude Haiku 4.5가 Claude Sonnet 4.5와 Claude Opus 4.1 모두와 비교했을 때 통계적으로 유의미하게 낮은 비정상 행동 발생률을 보이며, 회사의 현재까지 가장 안전한 성능을 입증한다고 보고했습니다. 이 모델은 AI 안전 수준 2(ASL-2) 표준 하에 출시되었으며, 이는 Anthropic의 더 강력한 모델들에 적용된 ASL-3 등급보다 덜 제한적인 분류입니다.​안전성 테스트 결과 화학, 생물학, 방사선 및 핵무기 생산과 관련된 위험이 제한적인 것으로 나타나 ASL-2 지정을 뒷받침했습니다. 이러한 안전 프로필은 규정 준수와 위험 관리가 중요한 고려 사항인 기업 배포에 Haiku 4.5를 특히 매력적으로 만듭니다.​이번 출시는 AI 기업들이 서버 비용과 에너지 소비를 줄이면서 강력한 성능을 제공할 수 있는 더 작고 효율적인 모델 개발에 점점 더 집중하고 있는 가운데 이루어졌습니다. Haiku 4.5를 통해 Anthropic은 Claude 모델 제품군을 구별해온 고급 기능을 유지하면서 비용에 민감한 시장에서 보다 효과적으로 경쟁할 수 있는 입지를 다졌습니다.
568 조회
0 추천
2025.10.16 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입