Loading...

AI 뉴스

구글 포토, 새로운 Veo 3 AI로 사진을 영상으로 업그레이드

페이지 정보

작성자 xtalfi
작성일 09.05 13:23
110 조회
0 추천
0 비추천

본문

662f4d59914531b9da2c8ba23c2ac9cblEOe.jpeg

(퍼플렉시티가 정리한 기사)

Google은 Google Photos의 사진-동영상 변환 기능을 자사의 첨단 Veo 3 인공지능 모델로 업그레이드했으며, 이는 최첨단 생성형 AI 기술을 일반 사용자에게 제공하려는 최신 조치입니다. 이 업그레이드는 수요일에 공식 발표되었으며 2025년 9월 4일부터 미국 사용자들에게 제공될 예정으로, 이전 Veo 2 시스템에 비해 동영상 품질이 크게 향상될 것을 약속합니다.

이 업그레이드는 Google Photos의 새로운 "Create"(만들기) 탭 내에 포함되어 있으며, 이 탭은 AI 기반 창작 도구를 한 곳에 모아놓은 허브로, 회사는 8월부터 점진적으로 이 기능들을 도입해 왔습니다. 사용자는 이미지를 선택한 후 "섬세한 움직임" 또는 "운에 맡기기"라는 두 가지 애니메이션 프롬프트 중 하나를 선택하여, 6초 길이의 고화질 동영상 클립을 생성할 수 있습니다.

 

향상된 비디오 품질 및 성능

Google 대변인 마이클 마르코니(Michael Marconi)에 따르면, Veo 3는 이전 버전에 비해 해상도와 전반적인 클립 품질 면에서 상당한 개선을 제공한다고 합니다. 업그레이드된 모델은 더 사실적인 물리 시뮬레이션, 더 나은 조명과 반사, 그리고 향상된 객체 추적 기능을 제공하여 이전 버전의 특징이었던 ‘부유하는 듯한 움직임’과 같은 일반적인 문제들을 해결했습니다.

주요 발전점은 Veo 3의 우수한 프롬프트 처리 능력에 있습니다. Veo 2가 기본적인 영화 촬영 지시만 수용했던 반면, Veo 3는 더 복잡한 시각적 지시를 더욱 직설적으로 실행하고, 일반적인 결과물을 줄여 사용자들이 원하는 예술적 의도에 더 근접한 클립을 만들어냅니다.

하지만 이 업그레이드는 몇 가지 절충점도 수반합니다. Veo 3를 통해 Google Photos에서 생성된 동영상의 길이는 이제 4초로, 이전의 6초 클립보다 짧아졌고, Veo 3가 기본적으로 소리 생성 기능을 갖추고 있음에도 불구하고 Gemini와 같은 다른 Google 제품에서와는 달리 음성 기능이 포함되어 있지 않습니다.

 

접근 제한 및 구독 등급

Google 포토 사용자는 하루에 제한된 수의 동영상 생성을 받을 수 있으며, 더 높은 할당량은 Google AI Pro(월 $20) 및 Google AI Ultra(월 $250) 구독자에게 제공됩니다. 무료 등급의 제한은 첨단 AI 동영상 생성에 필요한 계산 비용을 반영하며, 이는 업계 전반에 걸쳐 공통적으로 나타나는 제약입니다.

Create 탭에는 사진을 애니메이션이나 만화 삽화와 같은 다양한 예술적 스타일로 바꿔주는 Remix, 여러 이미지를 결합할 수 있는 Collage, 사진 라이브러리로부터 자동으로 음악이 포함된 몽타주 영상을 만들어주는 Highlight Videos 등 추가적인 AI 도구들도 포함되어 있습니다.

이러한 통합은 프리미엄 구독자에게만 제공됐던 첨단 AI 기능을, 2025년 5월 기준 월간 활성 이용자 15억 명 이상을 보유한 구글의 대표적인 사진 서비스로 대중화하려는 구글의 광범위한 전략을 반영하는 것입니다.

 

댓글 0
전체 190 / 20 페이지
애플 연구진은 기존보다 더 효율적으로 롱폼 비디오를 분석할 수 있는 대형 언어모델(LLM)인 SlowFast-LLaVA-1.5를 개발했다고 발표했다.애플은 'SlowFast' 구조(고해상도 소수 프레임+저해상도 다수 프레임)를 사용해 이미지와 영상 public 데이터셋을 모두 활용해 학습, 이미지만큼 영상 내 시간적 구조 이해도 가능하도록 했다. SF-LLaVA-1.5는 1B, 3B, 7B 파라미터 규모로 공개됐으며, LongVideoBench와 MLVU 같은 벤치마크에서 기존 더 큰 모델 대비 뛰어난 성능을 보였다. 특히 지식, 수학 추론, OCR 등 이미지 작업에서도 강점을 보였다.하지만 이 모델은 한 번에 최대 128프레임(빠름: 96, 느림: 32)만 입력받는다. 이 방식은 일부 중요한 프레임을 놓칠 수 있다는 한계가 있으며, 전체 매개변수와 비주얼 인코더까지 튜닝하려면 GPU 자원 소모가 크다. 연구진은 향후 메모리 절약, 성능 개선 기술의 적용 가능성을 언급했다.
184 조회
0 추천
2025.08.25 등록
올해 1월 AI 업계에 충격을 안겨준 중국 AI 스타트업 DeepSeek 는 기존 V3 모델의 업그레이드 버전인 V3.1을 공개했다.V3.1은 OpenAI의 최신 모델 GPT-5와 여러 벤치마크에서 견줄 만한 성능을 보이며, 가격경쟁력까지 갖추었다.DeepSeek V3.1은 중국에서 자체 개발된 AI 칩에 맞춰 최적화된 것이 특징이다. 이는 미국의 Nvidia 등 외국 기술 의존도를 낮추고, 미국의 수출 규제에 대응하려는 전략의 일환이다.DeepSeek는 WeChat과 Hugging Face에 모델을 공개하며, 중국 정부의 AI 자립 정책에 부응하고 있다.V3.1은 6850억 파라미터의 초대형 모델로, '미시처-오브-엑스퍼트(mixture-of-experts)' 구조를 통해 쿼리마다 일부만 활성화되어 연산 효율성과 비용 절감을 동시에 잡았다. 또한, 기존 모델이 '즉답형'과 '추론형'으로 분리됐던 것과 달리, 두 가지를 결합해 신속성과 논리적 추론을 함께 제공한다는 점이 돋보인다.
259 조회
0 추천
2025.08.22 등록
구글이 사진 앱에 수정사항을 텍스트로 바로 수정요청하는 기능을 적용.이 기능은 곧 런칭할 픽셀10에서부터 적용이 될 예정.또한 사진이 어떻게 편집되었는지 C2PA 인증 기술로 추적이 가능하다고.아래는 구글 블로그의 소개 내용.Google Photos에서는 이제 사진을 편집할 때 원하는 내용을 텍스트나 음성으로 직접 요청할 수 있습니다. 사용자는 어떤 편집 효과를 적용할지 직접 고르지 않아도 되고, 그저 "차를 배경에서 제거해줘"처럼 자연스럽게 말을 하면 AI가 알아서 반영해 줍니다. 이 기능은 미국의 Pixel 10 기기에서 우선 제공됩니다.새롭게 디자인된 사진 편집기는 직관적 UI와 AI 기반 제안으로 일반 사용자도 쉽게 다양한 효과를 활용할 수 있습니다. 이번에 도입된 대화형 편집 기능으로, 구체적인 요청뿐 아니라 "사진 복원해줘", "색감 보정해줘" 등 복합적인 요구도 한 번에 처리할 수 있습니다. 여러 번 연속해서 추가 요청을 하며 세부 조정도 가능합니다.밝기 조절, 배경 제거 같은 기본 편집뿐 아니라 배경 교체, 파티 모자 추가 등 창의적인 효과 요청도 대화로 손쉽게 처리할 수 있습니다. 사용자가 별도의 편집툴을 배우지 않아도 다양한 AI 편집을 자유롭게 즐길 수 있게 되었습니다.Pixel 10 기기에서는 C2PA(디지털 콘텐츠 인증) 기술이 적용되어, AI가 사진 수정에 개입한 흔적·정보를 확인할 수 있습니다. Google Photos에도 점진적으로 이 기능이 적용되며, 사진이 어떻게 만들어지고 어디에 AI 편집이 사용됐는지 투명하게 확인할 수 있습니다.
229 조회
0 추천
2025.08.22 등록
AI의 진화: 수동적 도구에서 자율적 에이전트로2023년까지 AI는 주로 문서 작성, 정보 조사 등의 보조 업무에 활용되는 수동적 도구였습니다. 하지만 2025년 현재 AI 에이전트는 기억하고 계획하며 독립적으로 행동할 수 있는 자율적 시스템으로 발전했습니다.실제 기업 도입 사례서비스나우(ServiceNow): IT 요청 처리를 완전 자동화하여 직원이 소프트웨어 설치나 라이선스 갱신을 요청하면 에이전트가 전 과정을 처리깃허브 코파일럿(GitHub Copilot): 개발자의 의도를 이해하고 반복적인 코딩 작업을 자동 수행하는 에이전트 모드 도입시스코 웹엑스(Webex): 고객 상담, 실시간 통화 지원, 대화 요약 및 감정 분석까지 여러 AI 에이전트가 협업하여 고객 지원 업무 처리성공 요인과 한계AI 에이전트는 명확하고 표준화된 절차를 따르는 작업에서 뛰어난 성과를 보입니다. 최근에는 복잡한 비즈니스 분석까지 수행할 수 있도록 발전하고 있지만, 여전히 작업 완료 시점을 정확히 판단하지 못하는 문제가 있습니다.도입 시 고려사항업무 프로세스 재설계: 기존 업무 방식에 AI를 단순히 추가하는 것이 아닌, 에이전트 중심의 업무 프로세스로 근본적 재설계 필요신뢰성 확보: 안전 규칙, 테스트 시스템, 명확한 기록 체계 구축이 필수새로운 역할 창출: 에이전트 관리, 모니터링, 컴플라이언스 점검을 담당하는 새로운 직무 등장 예상향후 전망앞으로 2년 내에 AI 에이전트는 고객 지원과 소프트웨어 개발 영역에서 일상적인 도구가 될 것으로 예상됩니다. 클라우드 플랫폼들도 에이전트 개발부터 운영까지 통합 솔루션을 제공할 가능성이 높습니다.
228 조회
0 추천
2025.08.21 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입