구글, 오디오 업그레이드를 탑재한 Veo 3.1 AI 비디오 모델 출시

xtalfi

15:44

(퍼플렉시티가 정리한 기사)

Google는 수요일에 지금까지 가장 진보된 AI 비디오 생성 모델인 Veo 3.1을 공개했으며, 향상된 오디오 기능, 객체 수준 편집 도구, 세로 비디오 형식 지원을 도입하면서 최근 업데이트된 OpenAI의 Sora 모델과의 경쟁을 강화하고 있습니다.

최신 버전은 5월에 출시되어 Google의 Flow 플랫폼을 통해 이미 2억 7,500만 개 이상의 비디오를 생성한 Veo 3를 크게 발전시킨 것입니다. Veo 3.1은 "더 풍부한 오디오, 더 많은 내러티브 제어, 실제와 같은 질감을 포착하는 향상된 사실감"을 제공하며, 계산 낭비를 줄이는 개선된 프롬프트 준수 기능을 제공합니다.

새로운 창의적 기능이 비디오 제작을 혁신하다

이 모델은 창작자들에게 AI 생성 콘텐츠에 대한 전례 없는 제어권을 제공하는 획기적인 기능을 도입합니다. 사용자는 이제 "Ingredients to Video" 기능을 통해 여러 참조 이미지를 업로드할 수 있으며, AI가 서로 다른 캐릭터, 객체 및 스타일을 동기화된 오디오와 함께 일관된 장면으로 병합할 수 있습니다.

특히 주목할 만한 추가 기능은 "Insert" 기능으로, 사용자가 자동 조명 및 그림자 조정과 함께 기존 비디오에 새로운 요소를 추가할 수 있습니다. Google은 곧 "Remove" 도구가 출시될 것이라고 약속하며, 이를 통해 원치 않는 객체를 자연스럽게 배경을 재구성하면서 매끄럽게 삭제할 수 있습니다.

현대 콘텐츠 창작자들에게 가장 중요한 점은 Veo 3.1이 이제 가로 16:9와 세로 9:16 화면 비율을 모두 지원하여 소셜 미디어용 콘텐츠에 대한 증가하는 수요를 충족시킨다는 것입니다. 이 모델은 또한 첫 번째와 마지막 프레임 이미지 사이의 전환을 생성하여 기존의 8초 제한을 넘어 1분 이상까지 확장되는 부드러운 내러티브 브리지를 만들 수 있습니다.

경쟁 환경이 뜨거워지다

이번 출시는 AI 비디오 생성 분야가 구글과 OpenAI 간의 양강 구도로 치열해지는 가운데 이루어졌습니다. 최근 비교 결과에 따르면 엇갈린 평가가 나오고 있으며, 일부 초기 사용자들은 특정 시나리오에서 Sora 2의 뛰어난 현실감을 언급하는 한편, Veo 3.1의 더 긴 생성 기능과 창의적 제어 기능을 칭찬하고 있습니다.

Tom's Guide는 "Sora 2가 AI의 틱톡이라면, Veo 3.1은 넷플릭스"라고 평가하며, 바이럴 준비된 클립보다 영화적 스토리텔링에 중점을 둔 이 모델의 특징을 강조했습니다.

Veo 3.1은 Google Flow, Gemini API, Vertex AI, 그리고 Gemini 앱을 통해 즉시 이용 가능하며, 가격은 이전 버전과 동일하게 표준 모델은 초당 $0.40, Fast 버전은 $0.15입니다. 접근을 위해서는 Google AI Pro 구독이 필요하며, AI 기반 비디오 제작을 도입할 준비가 된 전문 크리에이터와 기업 사용자를 대상으로 포지셔닝되어 있습니다.