Loading...

AI 뉴스

구글 포토, 새로운 Veo 3 AI로 사진을 영상으로 업그레이드

페이지 정보

작성자 xtalfi
작성일 09.05 13:23
25 조회
0 추천
0 비추천

본문

662f4d59914531b9da2c8ba23c2ac9cblEOe.jpeg

(퍼플렉시티가 정리한 기사)

Google은 Google Photos의 사진-동영상 변환 기능을 자사의 첨단 Veo 3 인공지능 모델로 업그레이드했으며, 이는 최첨단 생성형 AI 기술을 일반 사용자에게 제공하려는 최신 조치입니다. 이 업그레이드는 수요일에 공식 발표되었으며 2025년 9월 4일부터 미국 사용자들에게 제공될 예정으로, 이전 Veo 2 시스템에 비해 동영상 품질이 크게 향상될 것을 약속합니다.

이 업그레이드는 Google Photos의 새로운 "Create"(만들기) 탭 내에 포함되어 있으며, 이 탭은 AI 기반 창작 도구를 한 곳에 모아놓은 허브로, 회사는 8월부터 점진적으로 이 기능들을 도입해 왔습니다. 사용자는 이미지를 선택한 후 "섬세한 움직임" 또는 "운에 맡기기"라는 두 가지 애니메이션 프롬프트 중 하나를 선택하여, 6초 길이의 고화질 동영상 클립을 생성할 수 있습니다.

 

향상된 비디오 품질 및 성능

Google 대변인 마이클 마르코니(Michael Marconi)에 따르면, Veo 3는 이전 버전에 비해 해상도와 전반적인 클립 품질 면에서 상당한 개선을 제공한다고 합니다. 업그레이드된 모델은 더 사실적인 물리 시뮬레이션, 더 나은 조명과 반사, 그리고 향상된 객체 추적 기능을 제공하여 이전 버전의 특징이었던 ‘부유하는 듯한 움직임’과 같은 일반적인 문제들을 해결했습니다.

주요 발전점은 Veo 3의 우수한 프롬프트 처리 능력에 있습니다. Veo 2가 기본적인 영화 촬영 지시만 수용했던 반면, Veo 3는 더 복잡한 시각적 지시를 더욱 직설적으로 실행하고, 일반적인 결과물을 줄여 사용자들이 원하는 예술적 의도에 더 근접한 클립을 만들어냅니다.

하지만 이 업그레이드는 몇 가지 절충점도 수반합니다. Veo 3를 통해 Google Photos에서 생성된 동영상의 길이는 이제 4초로, 이전의 6초 클립보다 짧아졌고, Veo 3가 기본적으로 소리 생성 기능을 갖추고 있음에도 불구하고 Gemini와 같은 다른 Google 제품에서와는 달리 음성 기능이 포함되어 있지 않습니다.

 

접근 제한 및 구독 등급

Google 포토 사용자는 하루에 제한된 수의 동영상 생성을 받을 수 있으며, 더 높은 할당량은 Google AI Pro(월 $20) 및 Google AI Ultra(월 $250) 구독자에게 제공됩니다. 무료 등급의 제한은 첨단 AI 동영상 생성에 필요한 계산 비용을 반영하며, 이는 업계 전반에 걸쳐 공통적으로 나타나는 제약입니다.

Create 탭에는 사진을 애니메이션이나 만화 삽화와 같은 다양한 예술적 스타일로 바꿔주는 Remix, 여러 이미지를 결합할 수 있는 Collage, 사진 라이브러리로부터 자동으로 음악이 포함된 몽타주 영상을 만들어주는 Highlight Videos 등 추가적인 AI 도구들도 포함되어 있습니다.

이러한 통합은 프리미엄 구독자에게만 제공됐던 첨단 AI 기능을, 2025년 5월 기준 월간 활성 이용자 15억 명 이상을 보유한 구글의 대표적인 사진 서비스로 대중화하려는 구글의 광범위한 전략을 반영하는 것입니다.

 

댓글 0
전체 168 / 1 페이지
(퍼플렉시티가 정리한 기사)마스터카드는 수요일, 연말 쇼핑 시즌을 앞두고 "에이전틱 커머스(agentic commerce)"를 가능케 하는 종합적인 인공지능(AI) 기반 결제 도구 제품군을 발표했습니다. 이 기능들은 AI 에이전트가 소비자와 기업을 대신해 거래를 완료할 수 있도록 해줍니다.이 금융 서비스 대기업은 자사의 확장된 에이전트 페이(Agent Pay) 프로그램이 연말까지 미국 내 모든 카드 소지자를 대상으로 제공될 예정이며, 이후 곧 글로벌 확장도 계획하고 있다고 밝혔습니다. 씨티와 U.S.뱅크 고객들이 이 AI 기반 결제 기능을 가장 먼저 이용하게 될 예정이며, 이커머스 플랫폼들도 이 기술 통합을 준비하고 있습니다.새로운 개발자 도구 및 산업 파트너십마스터카드는 AI 기반 거래 채택을 가속화하기 위해 설계된 네 가지 주요 이니셔티브를 중심으로 발표를 진행했습니다. 이 회사는 자사의 개발자 플랫폼에서 에이전트 툴킷을 출시했는데, 이를 통해 AI 어시스턴트가 Model Context Protocol 서버를 통해 마스터카드 API에 원활하게 접근할 수 있게 하여 Claude, Cursor, GitHub Copilot 등 다양한 플랫폼과의 통합을 지원합니다.Agent Sign-Up 기능은 AI 에이전트를 위한 간소화된 등록 절차를 제공하며, Insight Tokens는 SAP Concur 및 Agentic Consulting Services의 지원을 받아 AI 에이전트가 소비자 허가 데이터를 접근할 수 있는 프레임워크를 만듭니다. 이 도구들은 개발자가 AI 결제 기능을 보다 효율적으로 통합할 수 있도록 도와주어, 업계 보도에 따르면 구현 시간을 몇 주에서 몇 시간으로 단축할 수 있습니다.마스터카드는 Stripe, Alphabet의 Google, Ant International의 Antom 등 주요 기술 기업들과 협력하여 에이전트 결제 산업 표준을 확립하고 있습니다. 이 파트너십은 FIDO Alliance와 함께 상인 및 거래 정보를 확인하는 자격 검증 시스템 개발에 주력하고 있으며, AI 에이전트가 결제 기능을 갖게 됨에 따라 제기되는 보안 문제를 해결하는 데 중점을 두고 있습니다.강화된 보안 및 거래 제어회사는 동시에 주문형 의사결정(On-Demand Decisioning)을 도입하여 금융 기관이 맞춤화 가능한 규칙 엔진을 통해 거래 승인에 대한 실시간 제어 권한을 행사할 수 있도록 했습니다. 이 도구는 발급사가 승인 기준을 설정하고, 오탐지 거절을 줄이며, 고가치 고객을 위한 승인 우선순위를 부여할 수 있게 하며, 마스터카드의 RiskX 서밋(로마)에서 처음 공개되었습니다.마스터카드의 최고 제품 책임자인 요른 램버트(Jorn Lambert)는 "에코시스템 전반의 파트너들과 협력하여 에이전틱 커머스를 정의할 표준과 도구를 구축하고 있다"고 밝혔습니다. 이 이니셔티브는 인공지능 기반 에이전트가 최소한의 인간 개입으로도 복잡한 구매 업무를 안전하게 수행할 수 있게 하는 자동화된 디지털 거래 패러다임으로의 중요한 전환을 의미합니다.마스터카드 주식은 올해 들어 11% 상승했으며, 이는 S&P 100 지수의 12% 수익률에 약간 못 미치는 수치로, 회사가 변화하는 디지털 결제 시장에서 가치를 창출하기 위한 다양한 이니셔티브를 추진하고 있음을 보여줍니다.[퍼플렉시티에 추가 질문-답변]추가 질문: "이 기술은 어떻게 동작하는가"Mastercard의 에이전트 상거래(Agentic Commerce) 및 Agent Pay 기술은 AI 에이전트가 사용자의 결제 요청을 받아 직접 결제를 실행하는 자동화·보안 기반 시스템입니다.주요 동작 원리- AI 에이전트 인터페이스사용자가 챗봇이나 음성 비서 등에 요청(예: "운동화 사줘")을 하면, AI 에이전트가 사용자의 선호와 구매 조건을 파악하고, 다양한 온라인 쇼핑 플랫폼에서 상품을 자동 탐색·비교합니다.- 결제 자동화 및 토큰화선택된 상품·서비스에 대해 구매가 결정되면, AI 에이전트는 결제 요청을 마스터카드 네트워크로 전송합니다. 실제 카드 정보 대신 Agentic Token이라는 임시·암호화 토큰이 발급되어 결제가 처리되므로 개인 정보 노출 없이 안전하게 거래가 이루어집니다.- 에이전트 등록 및 검증모든 AI 에이전트는 사전 등록·신뢰 검증을 받아야 하며, 인증된 에이전트만이 결제 토큰을 요청할 수 있습니다. 사용자는 에이전트가 사용할 수 있는 한도(예: 최대 결제금액, 지정 상점 등)나 승인 조건까지 세밀하게 통제할 수 있습니다.- 실시간 인증 및 사기 모니터링결제 과정에서 추가 인증(생체인증, 패스키 등)을 통해 보안이 강화되어 있으며, Mastercard의 AI 기반 위험 감지 시스템이 실시간으로 거래의 이상 징후를 모니터링해 보안 위협과 사기를 예방합니다.거래 흐름 요약1. 사용자의 요청 → AI 에이전트가 상품 탐색·추천2. 구매 결정 → 에이전트가 결제 토큰 발급 요청3. Mastercard에서 토큰 발급 및 결제 승인4. 사용자 지정 조건(한도, 매장 등) 및 실시간 인증·보안 적용5. 거래 완료 후 기록과 데이터가 자동 축적되고, 필요시 사용자 최종 승인도 가능.핵심 기술- Mastercard Agentic Tokens: 실카드 정보 노출 없이 임시 결제 권한을 주는 보안 토큰.- AI 기반 사기 방지 시스템: 실시간 위험 감지로 결제 안전 강화.- 사용자·기관 맞춤형 제어: On-Demand Decisioning을 통해 거래 승인·거절 조건을 실시간 자동화.이 기술은 AI가 기존의 단순 추천에서 한 단계 더 나아가, 결제까지 자동으로 수행하며, 사용자와 기관 모두에게 강력한 제어권과 최신 보안 환경을 제공합니다.
2 조회
0 추천
00:31 등록
(퍼플렉시티가 정리한 기사)오픈AI가 10일 서울 광진구 파이팩토리 스튜디오에서 기자회견을 열고 한국 지사인 '오픈AI 코리아'의 공식 출범을 발표했다. 아시아에서 세 번째, 전 세계에서 열두 번째가 되는 오픈AI 코리아는 한국을 차세대 글로벌 AI 허브로 선택했다고 밝혔다.제이슨 권 오픈AI 최고전략책임자(CSO)는 이날 기자회견에서 "한국은 세계적 수준의 인프라, 혁신적인 기업, 빠른 디지털 도입 속도를 갖춘 AI 혁신의 최적지"라며 "구독자에게 있어서도 한국은 중요한 시장이기 때문에 데이터센터 설립을 고려하고 있다"고 말했다.한국 시장의 전략적 가치 입증오픈AI가 한국을 아시아 3번째 거점으로 선택한 배경에는 놀라운 성장 수치가 뒷받침되고 있다. 한국은 챗GPT 유료 구독자 수에서 미국에 이어 세계 2위를 차지하고 있으며, 국내 챗GPT 주간 활성 사용자(WAU)는 1년 전보다 4배 증가했다. 유료 구독자 규모도 전년 대비 3배 이상 늘어 아시아태평양 지역 최대 규모를 기록했다.API 활용 측면에서도 한국은 전 세계 10위권 내에 포함되어 있으며, 오픈AI의 글로벌 주간 활성 사용자는 7억 명을 넘어서고 있다. 2025년 5월 기준으로는 챗GPT의 국내 월간 활성 이용자 수가 1000만 명을 돌파한 바 있다.산업계·학계·정부와 전방위 협력오픈AI 코리아는 출범과 함께 다각적인 협력 네트워크 구축에 나선다. 11일에는 서울대학교와 업무협약(MOU)을 체결해 학계와의 연구 협력을 본격화할 예정이며, '오픈AI 포 컨트리즈(OpenAI for Countries)' 이니셔티브를 통해 한국 정부와의 협력도 강화해 나간다.이미 2월 카카오와 전략적 제휴를 맺은 후 챗GPT와 카카오 생태계 연동을 준비하고 있으며, 건설, 전자, 통신, 금융, 여행, 게임, 이커머스, 엔터테인먼트 등 다양한 산업 분야의 선도 기업들이 GPT-5 등 최첨단 AI 기술을 적극 도입하고 있다.스타트업 생태계 지원 확대스타트업 생태계 육성도 오픈AI 코리아의 핵심 과제다. 2월 국내 최초 개발자 워크숍인 빌더랩을 개최한 데 이어, 12일에는 파운더스 데이를 열어 스타트업, 개발자, 벤처캐피털(VC) 간 네트워킹의 장을 마련할 예정이다. 11월에는 개발자와 스타트업, AI 연구자들을 한자리에 모아 오픈AI의 최신 기술을 공유하는 '데브데이 익스체인지(DevDay Exchange)'를 국내에서 개최할 계획이다.제이슨 권 CSO는 지난달 25일 미국 워싱턴 DC에서 열린 한미 비즈니스 라운드 테이블에서 삼성전자 이재용 회장, SK그룹 최태원 회장, 네이버 최수연 대표 등과 만나 "한국과 장기적 투자 고려 중이기 때문에 이들 CEO들과 고민을 함께 나눴다"고 밝혔다.다만 한국 지사장 채용은 아직 진행 중이다. 제이슨 권 CSO는 "한국 지사장과 관련해서는 곧 말씀드릴 수 있을 것"이라고 언급했다.
2 조회
0 추천
00:25 등록
(퍼플렉시티가 정리한 기사)마이크로소프트(Microsoft)는 Office 365 애플리케이션에 앤트로픽(Anthropic)의 인공지능 기술을 통합하고 있으며, 이는 오픈AI(OpenAI) 모델에만 의존하던 전략에서 벗어난 새로운 움직임입니다. 오늘 The Information에 보도된 바에 따르면, 이번 파트너십을 통해 두 회사의 기술이 마이크로소프트의 생산성 제품군 내에서 함께 작동할 예정이며, 개발자들은 앤트로픽의 최신 모델이 특정 자동화 작업에서 오픈AI를 능가할 수도 있다고 언급하고 있습니다.Anthropic 모델은 사무 작업에서 뛰어난 성과를 보입니다.Anthropic의 기술을 도입하기로 한 결정은 AI 기업의 최신 모델들, 특히 Claude Sonnet 4가 특정 Office 365 기능 자동화에서 우수한 성능을 보인 테스트 결과에 따른 것입니다. Microsoft의 생산성 앱용 AI 기능 개발에 참여한 개발자들은 Anthropic의 모델들이 특히 Excel에서의 재무 계산 실행 및 특정 지시 사항에 따른 PowerPoint 프레젠테이션 생성에서 뛰어남을 발견했습니다.이번 협력은 Microsoft가 Office 365의 AI 역량을 위해 이전까지 독점적으로 의존하던 OpenAI 기술에서 처음으로 의미 있는 전환을 시도하는 것입니다. 수년간 OpenAI의 모델이 Word, Excel, Outlook, PowerPoint 전반의 Copilot 기능을 구동해왔으나, 이제 회사는 AI 포트폴리오를 다각화하여 여러 공급업체를 포함시키고 있습니다.파트너십 갈등 속에서의 전략적 전환이 같은 상황은 마이크로소프트와 오픈AI 간의 관계에 대한 압력이 점점 커지고 있는 가운데 벌어지고 있습니다. 소프트웨어 거대 기업인 마이크로소프트는 2019년 이후 오픈AI에 130억 달러 이상을 투자했지만, 양사의 파트너십 계약은 2030년에 만료될 예정입니다. 최근 협상에서는 지분율, 수익 분배 방식, 독점적 권리 등에 초점이 맞춰졌으며, 오픈AI는 현재 20%인 마이크로소프트의 수익 지분을 줄이고자 하는 것으로 알려졌습니다.마이크로소프트는 자체 AI 모델인 MAI도 개발해왔으며, 이 모델들은 오픈AI와 Anthropic의 주요 모델과 비슷한 성능을 보이고 있습니다. 마이크로소프트는 8월에 MAI-Voice-1과 MAI-1-preview를 선보였는데, 이는 회사의 최초의 엔드투엔드 기반 모델로, 외부 AI 공급업체에 대한 의존도를 줄이려는 더 넓은 전략을 나타냅니다.AI 모델 포트폴리오 확장Anthropic의 통합은 Microsoft가 OpenAI를 넘어 인공지능 역량을 다양화하려는 광범위한 노력의 일부입니다. 이 회사는 Copilot 프레임워크 내에서 성능을 평가하기 위해 DeepSeek, Meta, xAI를 포함한 다양한 업체의 AI 모델을 테스트해 왔습니다. 이러한 다중 모델 접근법은 Microsoft가 다양한 비즈니스 분야에 맞춤형 솔루션을 제공하면서 단일 AI 공급업체에 대한 의존도를 줄일 수 있게 해줍니다.현재 Microsoft와 OpenAI의 파트너십은 OpenAI 모델을 자사 제품 및 클라우드 인프라에 통합할 독점 권한을 포함합니다. 하지만 최근 변경으로 인해 OpenAI의 Azure 독점권이 수정되어, Microsoft가 용량 요구를 충족하지 못할 경우 OpenAI가 다른 클라우드 공급자를 사용할 수 있는 '선매권(right of first refusal)' 모델로 전환되었습니다.Anthropic 기술의 Office 365 통합은 기업용 AI 환경이 변화하고 있음을 보여줍니다. 기업들은 점점 단일 공급업체 솔루션 대신, 유연성과 성능 최적화를 추구하고 있습니다. Microsoft와 Anthropic 모두 The Information의 보도 당시 파트너십 세부 사항에 대한 공식 입장을 내놓지 않았습니다.
4 조회
0 추천
00:10 등록
(퍼플렉시티가 정리한 기사)Google은 Android, iOS, 웹 플랫폼 전반에서 Gemini AI 앱에 오디오 파일 업로드 기능을 추가하여 사용자들의 압도적인 수요에 응답했습니다. Google Labs 및 Gemini 부사장 Josh Woodward는 오디오 지원이 앱 출시 이후 사용자들이 요청한 "가장 많은 요청"이었다고 X에서 발표했습니다.이 기능을 통해 사용자는 MP3, WAV, M4A 등 일반적인 오디오 파일 형식을 앱의 업로드 인터페이스를 통해 직접 업로드할 수 있습니다. 무료 사용자는 하루 5번의 프롬프트로 총 10분 길이의 오디오를 처리할 수 있으며, Google AI Pro 또는 AI Ultra 플랜 구독자는 최대 3시간 분량의 오디오 업로드로 훨씬 더 많은 용량을 제공받습니다.멀티모달 AI 역량 확장이 오디오 기능은 사용자가 Gemini와 상호작용하는 방식을 변화시키며, 인터뷰를 기록하거나 음성 메모를 분석하고 강의 녹음을 검색 가능한 콘텐츠로 변환하는 등 새로운 사용 사례를 가능하게 합니다. 사용자는 이제 회의 녹음을 업로드하여 실행 항목이 포함된 요약을 요청하거나 대학 강의를 제출해 학습 가이드 생성을 요청할 수 있습니다.이번 업데이트는 Gemini를 수개월 전부터 오디오 업로드 기능을 지원해 온 OpenAI의 ChatGPT와 같은 경쟁업체들과 기능적 균형에 더 가까워지게 합니다. Android Police에 따르면, 올해 초 파일 업로드가 제공된 이후로 오디오 지원이 없었던 것은 "이상한 누락"이었다고 합니다.더 넓어진 제미니 생태계 업데이트오디오 기능과 함께, 구글은 AI 모드 검색 경험을 인도어, 인도네시아어, 일본어, 한국어, 브라질 포르투갈어 등 5개 새로운 언어로 확장했습니다. 이번 확장에서는 Gemini 2.5 기술의 맞춤형 버전을 활용하여 단순 번역을 넘어 문화적으로 적합한 답변을 제공합니다.구글은 또한 NotebookLM 연구 보조 도구를 80개 이상의 언어에서 사용자 맞춤형 보고서 형식을 지원하도록 업그레이드하여, 사용자가 업로드한 자료로부터 학습 가이드, 요약 문서, 블로그 글, 퀴즈 등을 생성할 수 있도록 했습니다. 이제 이 플랫폼은 사용자의 선호도에 따라 특정 구조, 스타일, 톤으로 보고서를 작성할 수 있습니다.오디오 업로드 기능은 빠르게 진화하는 인공지능 분야에서 멀티모달 기능의 중요성이 커지고 있는 가운데 구글이 자사의 AI 도구를 더욱 다양하고 경쟁력 있게 만들기 위한 지속적인 노력을 보여줍니다. 이러한 기능은 사용자 참여와 생산성 향상에 중요하게 작용합니다.
4 조회
0 추천
00:07 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입