Loading...

AI 뉴스

유튜브 쇼츠에 Veo 3 AI 영상 생성 기능 추가

페이지 정보

작성자 xtalfi
작성일 2025.09.17 16:12
1,566 조회
0 추천
0 비추천

본문

26aa268599875fe01dff912157516376tLr1.png

(퍼플렉시티가 정리한 기사)

유튜브는 화요일 뉴욕시에서 열린 ‘Made on YouTube’ 이벤트에서 AI 기반의 종합적인 창작 도구 모음을 공개하며, 틱톡과 인스타그램과의 창작자 경쟁에서 플랫폼 사상 가장 야심찬 인공지능 도입을 알렸다. 이 동영상 대기업은 구글의 딥마인드(DeepMind) 기술로 구동되는 최첨단 기능을 선보이는 한편, 지난 4년 동안 창작자, 아티스트, 미디어 회사들에게 1,000억 달러 이상을 지급했다고 발표했다.


주요 AI 동영상 생성 기능


YouTube는 Google DeepMind의 Veo 3 Fast 동영상 생성 모델의 맞춤형 버전을 Shorts에 직접 통합하여, 창작자들이 텍스트 프롬프트만으로 480p 해상도의 시청각 콘텐츠를 무료로 제작할 수 있게 했습니다. 이 기능은 미국, 영국, 캐나다, 호주, 뉴질랜드의 창작자들에게 우선 제공됩니다.


“YouTube 공식 블로그 포스트에 따르면, 이번이 처음으로 텍스트 프롬프트만으로 소리가 포함된 동영상을 생성할 수 있게 되었습니다”. 플랫폼은 향후 몇 달 내에 Veo의 기능을 확대해 모션 애니메이션, 팝 아트나 오리가미 등 다양한 효과의 영상 스타일화, 그리고 텍스트 설명을 통한 오브젝트 삽입 등을 지원할 예정입니다.


또한 YouTube는 Speech to Song이라는 리믹스 도구도 선보였습니다. 이 도구는 Google DeepMind의 Lyria 2 AI 음악 모델을 이용해 기존 동영상의 대사를 음악 사운드트랙으로 변환합니다. 창작자들은 “chill”, “danceable”, “fun” 등 다양한 스타일을 선택해 자신만의 “vibe”를 곡에 더할 수 있으며, 최종 결과물에는 원작자의 저작권이 표기됩니다.


크리에이터 관리 및 분석 도구


유튜브 플랫폼은 3천만 명이 넘는 월간 크리에이터들을 위한 유튜브 스튜디오 내 AI 챗봇, ‘Ask Studio’를 공개했습니다. 이 대화형 도구는 분석 자료에 대한 인사이트를 제공하고, 댓글을 요약하며, 채널 성과 데이터를 바탕으로 새로운 영상 아이디어를 생성합니다.


“YouTube는 ‘최근 영상을 누가 어떻게 보고 있는지 알려줘’ 또는 ‘내 편집 스타일에 대해 커뮤니티가 뭐라고 하는지 말해줘’ 같은 질문을 해보라고 설명했습니다. 회사는 Ask Studio를 ‘모든 크리에이터를 위한 최고의 창작 파트너’로 자리매김하고 있습니다.


또한, 유튜브는 썸네일과 제목의 조합 테스트를 통해 성과를 최적화할 수 있도록 A/B 테스트 기능을 강화했습니다. 플랫폼은 모든 유튜브 파트너 프로그램 크리에이터를 대상으로 본인 얼굴 이미지를 활용한 무단 AI 생성 영상을 식별하는 유사 이미지 감지 도구의 오픈 베타 서비스를 확대했습니다.


향상된 생산 및 협업 기능


Edit with AI는 원본 영상을 자동으로 최고의 순간들로 편집하고, 음악·전환 효과·영어 또는 힌디어 음성 해설을 추가하여 다듬어진 초안을 만들어 줍니다. 이 기능은 Shorts와 유튜브 Create 앱에서 테스트되고 있습니다.


또한 이 플랫폼은 최대 다섯 명의 크리에이터가 함께 영상 작업을 할 수 있는 향상된 협업 도구를 도입하여 가시성과 도달 범위를 높였습니다. 유튜브는 자동 더빙 기능도 확장하여 더빙 언어에 맞게 입술 움직임을 동기화할 수 있도록 했으며, 가로 및 세로 동시 라이브 스트리밍 등 새로운 라이브 기능도 추가했습니다.


TechCrunch에 따르면, 이러한 발표들은 유튜브가 “AI에 대한 대규모 투자가 성과를 내고 있음을 보여주려는” 노력의 일환이며, 플랫폼이 경쟁사에 맞서기 위해 “점점 더 대담한 시도를 하고 있다는” 점을 의미합니다. 각 기능들은 구글의 SynthID 워터마크 및 콘텐츠 라벨을 사용해 AI 생성 콘텐츠임을 식별하며, 인공 영상과 진짜 영상을 구분해야 한다는 우려를 해소하려 합니다.

댓글 0
전체 1,248 / 283 페이지
구글이 어학 학습 서비스 듀오링고에 대응하는 새로운 개선을 내놓는다. 고 테크크런치가 보도.구글은 구글 번역 앱에 새로운 AI 기반 언어 학습 기능을 도입하며, 언어 학습 앱 듀오링고에 도전장을 내밀었다. 이 기능은 초보자부터 고급 학습자까지 맞춤형 듣기와 말하기 연습 세션을 제공하며, 사용자의 실력과 학습 목표에 따라 조정된다. 사용자는 앱에서 "연습" 옵션을 선택해 자신의 수준과 목표를 설정한 뒤, 맞춤형 대화 시나리오를 통해 단어와 문장을 익힐 수 있다. 이 기능은 2025년 8월 26일부터 안드로이드와 iOS용 구글 번역 앱에서 베타 버전으로 제공되며, 영어, 스페인어, 프랑스어, 포르투갈어 사용자에게 우선 지원된다또한, 구글은 실시간 대화 번역 기능을 강화해 70개 이상의 언어로 자연스러운 대화를 지원한다. 사용자는 "실시간 번역" 옵션을 선택해 대화 상대의 언어를 번역하고, 음성과 텍스트로 동시에 확인할 수 있다. 이 기능은 소음이 많은 환경에서도 억양과 음성을 정확히 인식하며, 미국, 인도, 멕시코에서 먼저 사용 가능하다. 구글은 AI와 머신러닝 기술의 발전으로 번역 품질과 속도를 크게 개선했다고 밝혔다새로운 언어 연습 기능은 사용자의 일일 진행 상황을 추적하며, 듣기 연습에서는 대화 속 단어를 선택해 이해도를 높이고, 말하기 연습에서는 발음을 연습할 수 있다. 이는 듀오링고의 게임화된 학습 방식과 유사하지만, 구글은 AI를 활용해 개인화된 학습 경험을 강조한다. 구글은 이 기능이 기존 학습 도구와 함께 사용되도록 설계되었다고 전하며, 독립적인 학습 앱보다는 보완적인 도구로 포지셔닝했다구글은 또한 ‘작은 레슨(Tiny Lesson)’, ‘슬랭 행(Slang Hang)’, ‘워드 캠(Word Cam)’ 같은 실험적 AI 도구를 통해 언어 학습을 더욱 동적이고 개인화된 경험으로 만들고 있다. 예를 들어, ‘작은 레슨’은 특정 상황에 필요한 어휘와 문법을 제공하고, ‘슬랭 행’은 현지 slang과 대화를 학습할 수 있게 한다. ‘워드 캠’은 사진 속 사물을 인식해 해당 언어로 단어를 제시한다. 이 도구들은 현재 아랍어, 중국어, 영어, 프랑스어 등 여러 언어를 지원하며, 구글 랩에서 체험할 수 있다구글의 이번 업데이트는 약 1조 단어에 달하는 번역 데이터를 처리하며 언어 장벽을 낮추는 데 기여할 것으로 기대된다. 그러나 구글은 이 기능들이 실험 단계에 있으며, 일부 slang이나 단어 생성에서 오류가 발생할 수 있다고 경고했다. 따라서 사용자는 결과를 다른 신뢰할 수 있는 출처와 교차 검증해야 한다. 구글은 앞으로 더 많은 언어와 국가로 기능을 확장하고, 언어 학습 파트너와 협력해 콘텐츠를 강화할 계획이다.
1801 조회
0 추천
2025.08.27 등록
구글이 AI 이미지 모델을 대폭 업그레이드한 'Gemini 2.5 Flash Image'를 출시하며 자연어 명령으로 이미지를 생성하고 기존 사진을 병합하며 이상한 왜곡 없이 정밀 편집할 수 있는 기능을 제공한다고 발표했다.이번 업그레이드는 업계 선두인 오픈AI(OpenAI)와의 격차를 줄이려는 시도로, ChatGPT가 7억 명의 주간 사용자를 보유한 반면 구글 Gemini는 4억 5천만 명의 월간 사용자에 머물러 있다. 구글은 여러 편집 과정에서 캐릭터나 객체의 일관성을 유지하는 AI의 가장 큰 난제 중 하나를 해결했다고 밝혔으며, 사용자가 간단한 명령으로 배경 흐리기, 티셔츠 얼룩 제거, 자세 변경, 흑백 사진에 색상 추가 등의 세밀한 작업을 할 수 있다고 설명했다.공식 출시 전 이 모델은 크라우드소싱 평가 플랫폼 LMArena에서 'nano-banana'라는 익명으로 등장해 샘 알트만(Sam Altman)의 셔츠 색깔을 바꾸는 등 놀라운 성능을 보여주며 화제가 됐다. 새 모델은 Gemini 앱뿐만 아니라 개발자들이 Gemini API, 구글 AI 스튜디오, Vertex AI를 통해 접근할 수 있으며, 부동산 목록 카드, 직원 유니폼 배지, 제품 목업 제작 등 실제 사용 사례에서 활용되고 있다.
1888 조회
1 추천
2025.08.27 등록
애플이 9월 9일 오전 10시 미국 시간 기준, 한국시간 10일 새벽 2시 새 아이폰을 발표하는 이벤트를 연다.온라인을 통해서도 생중계되는 이번 행사에서는 신형 아이폰(iPhone)17 이 공개될 것으로 예상된다.이번 출시 행사의 테마는 ‘Awe Dropping(경외심 떨어짐)'으로, '형언할 수 없다'는 의미를 담고있다.이번에 출시되는 아이폰과 시리는 인공지능 AI 연동이 얼마나 될 것인지가 많은 관심을 받고 있다.
1836 조회
0 추천
2025.08.27 등록
Grok 을 서비스하고 있는 xAI 가 애플과 오픈AI를 고소했다.이유는 애플 앱스토어에 자사의 인공지능 앱 Grok 의 순위가 밀려났기 때문이라고.xAI는 애플이 오픈AI와의 독점 계약 때문에 X와 Grok 앱을 앱스토어에서 더 높은 위치에 올릴 이유가 없으며, 이는 경쟁을 막기 위한 담합이라고 주장했다. 여기서 말하는 독점 계약이란 애플과 OpenAI 간의 제품 통합 기능을 의미한다.하지만 시장에서는 xAI의 주장과 달리 다른 AI 앱들 즉 DeepSeek와 Perplexity도 최근 앱스토어 상위권을 기록한 바 있어서, 애플-오픈AI 파트너십이 실질적 독점으로 이어지는지에 대해서는 의견이 엇갈리고 있다.오픈AI CEO 샘 올트먼은 머스크의 주장을 "놀라운 주장"이라며 비판했고, 오픈AI 대변인은 이번 소송을 머스크의 "지속적인 괴롭힘 패턴"의 일환이라고 밝혔다. 올트먼은 머스크가 자신의 소셜 플랫폼 X의 알고리즘을 개인적으로 조작한 혐의를 언급하기도.xAI는 소송을 텍사스 북부 포트워스 연방지법에 냈고, 이는 머스크가 보수적 판결 경향을 선호해 소송을 같은 법원에 집중하는 '재판부 고르기' 행태로 해석됩니다. 애플은 아직 공식적인 답변을 내놓지 않은 상태이다
1839 조회
0 추천
2025.08.26 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입