AI 뉴스

Grok, X에 이미지-투-비디오 도구 추가

페이지 정보

작성자 xtalfi
작성일 2025.11.11 14:52
1,091 조회
0 추천
0 비추천

본문

Grok-logo-on-an-Android-phone-with-an-AI-type-background_cpf6o8.jpg

(퍼플렉시티가 정리한 기사)


일론 머스크는 11월 8일 Grok의 새로운 이미지-비디오 애니메이션 기능을 공개했으며, 사용자들이 간단한 길게 누르기 제스처와 맞춤형 텍스트 프롬프트를 통해 정지 사진을 짧은 비디오 클립으로 변환할 수 있게 했다. Grok Imagine 도구로 구동되는 이 기능은 X에 직접 통합되어 사용자들이 플랫폼에서 AI 생성 비디오 콘텐츠를 만들 수 있도록 한다.​

토요일 아침 일찍 X에서 이 도구를 시연하며, 머스크는 정지 이미지에서 생성된 "I will always love you"라고 말하는 여성의 AI 생성 비디오를 게시했다. 그는 나중에 두 사람이 머펫으로 변하는 또 다른 예시를 공유하며 다음과 같이 썼다: "어떤 이미지든 길게 눌러서 비디오로 만드세요! 그런 다음 프롬프트를 맞춤 설정하여 상상할 수 있는 모든 것을 만들어보세요".​


Grok 4 플랫폼과의 통합

비디오 생성 기능은 2025년 10월 버전 0.9로 업그레이드된 xAI의 Grok Imagine 도구를 기반으로 합니다. 이 시스템은 배경 음악, 대화 및 음향 효과를 포함한 동기화된 오디오와 함께 6초에서 15초 범위의 비디오를 생성할 수 있습니다. 보고서에 따르면, Grok Imagine을 구동하는 Aurora 엔진은 평균 약 17초 만에 비디오를 생성하여 Adobe, Google 및 OpenAI의 도구들과 경쟁력 있는 위치를 차지하고 있습니다.​

Grok 4는 2025년 8월 전 세계 모든 사용자에게 무료로 제공되었지만, 무료 등급에는 12시간마다 약 5회의 쿼리 제한을 포함한 사용 제한이 있습니다. 프리미엄 구독자 및 Premium+ 플랜 사용자는 더 빠른 응답 시간, 확장된 컨텍스트 길이 및 고급 SuperGrok 모드에 대한 액세스를 받습니다. 월 $300의 비용이 드는 SuperGrok Heavy 구독은 모델의 최고 성능 버전을 제공합니다.​


경쟁 환경

이번 출시로 xAI는 기존 AI 영상 생성 플랫폼들과 직접적인 경쟁 관계에 놓이게 되었습니다. Adobe는 Firefly 도구를 통해 유사한 이미지-투-비디오 기능을 제공하며, 정지 이미지를 실사 영상으로 변환할 수 있습니다. Google의 Veo 3와 OpenAI의 Sora는 모두 동기화된 오디오와 함께 AI 생성 영상을 제작하지만, 해상도, 길이, 생성 속도 면에서 각기 다른 강점을 가지고 있습니다.​

머스크의 발표 이후, X 사용자들은 빠르게 이 기능을 실험하기 시작했으며, 플랫폼 전반에 걸쳐 AI 생성 클립을 공유했습니다. 이 도구는 X 플랫폼과 Grok의 독립형 모바일 애플리케이션 모두를 통해 이용할 수 있습니다.

댓글 0
전체 1,366 / 87 페이지
Google은 미국 외 지역에서 최대 규모의 인공지능 인프라 하드웨어 엔지니어링 센터를 대만에 개설했으며, 라이칭더 총통은 이번 조치가 대만이 신뢰할 수 있는 기술 파트너이자 안전한 AI 개발을 위한 핵심 허브임을 입증하는 것이라고 설명했다.타이베이에 위치한 이 시설은 매일 수십억 명의 사람들이 사용하는 기기에 전력을 공급하는 전 세계 Google 데이터 센터에 배치되는 기술을 개발하고 테스트할 예정이라고 Google Cloud 부사장 아머 마흐무드가 밝혔다.대만은 전 세계 반도체의 60% 이상, 최첨단 칩의 90% 이상을 생산하고 있으며, AI 수요가 급증하는 가운데 TSMC만으로도 계약 칩 제조 분야에서 64%의 글로벌 시장 점유율을 차지하고 있다.
798 조회
0 추천
2025.11.20 등록
**마이크로소프트(Microsoft)**의 AI CEO **무스타파 술레이만(Mustafa Suleyman)**은 Copilot과 Windows에 AI가 통합되는 것에 불만을 가진 비평가들에게 반박하며, 사람들이 AI와 유창하게 대화하고 이미지와 동영상을 생성할 수 있는 능력에 감명을 받지 않는다는 사실에 “정말 놀랐다”고 말했다.술레이만의 옹호는 최근 The Verge의 보고서에서 실제 Copilot의 기능이 **마이크로소프트(Microsoft)**가 광고에서 보여주는 것과 맞지 않는다는 점이 지적된 가운데 나왔으며, Windows 사장 **파반 다불루리(Pavan Davuluri)**가 “대리 OS(agentic OS)” 비전을 홍보하다가 심한 반발을 받아 자신의 게시물에서 답글 기능을 비활성화해야 했던 사건에 이어졌다.이 논란은 **마이크로소프트(Microsoft)**가 새로운 “AI를 위한 당신의 캔버스(Your canvas for AI)” 슬로건을 밀어붙이는 가운데, Windows의 평판이 해당 매체가 “역대 최저”라고 묘사할 정도로 떨어진 상황을 부각시킨다. 사용자들은 모든 인터페이스에 원하지 않는 AI 기능을 강제로 넣는 대신 회사가 근본적인 플랫폼 문제를 해결할 것을 요구하고 있다.
794 조회
0 추천
2025.11.20 등록
Google DeepMind는 Boston Dynamics의 전 최고기술책임자(CTO)인 Aaron Saunders를 하드웨어 엔지니어링 부사장으로 영입했습니다. 이는 CEO Demis Hassabis가 Gemini를 Android가 여러 제조업체의 스마트폰을 구동하는 것처럼 범용 로봇 운영체제로 변모시키려는 비전을 발전시키기 위한 것입니다.Hassabis는 Gemini가 “거의 모든 물리적 구성으로 즉시 작동할 수 있는” AI 기반으로 기능하기를 목표로 하며, 이는 인간형 및 비인간형 로봇을 포함하여 회사가 AI 기반 로봇공학 분야로의 진출을 강화하고 있는 가운데 추진되고 있습니다.이러한 움직임은 Google DeepMind를 2035년까지 510억 달러 규모에 달할 것으로 예상되는 급속히 성장하는 시장에서 경쟁할 수 있는 위치에 올려놓습니다. 경쟁사인 Tesla는 향후 10년간 백만 대의 Optimus 인간형 로봇 생산을 목표로 하고 있으며, Unitree와 같은 중국 기업들은 경쟁력 있는 가격의 다리 달린 로봇을 제공하고 있습니다
765 조회
0 추천
2025.11.20 등록
MIT 연구원들은 새로운 추론 AI 모델에서 가장 많은 연산 처리를 요구하는 문제 유형이 인간이 해결하는 데 가장 오래 걸리는 문제와 동일하다는 것을 발견했으며, 이는 인공지능과 생물학적 지능이 복잡한 사고에 접근하는 방식에서 예상치 못한 수렴을 시사합니다PNAS에 게재된 이 연구는 7가지 문제 유형에 걸쳐 인간의 반응 시간과 AI가 생성한 “토큰”(내부 연산 단계)을 측정했으며, 놀라운 상관관계를 발견했습니다—인간과 모델 모두 “ARC 챌린지“라고 불리는 시각적 추론 과제에 가장 오래 걸리고 기본 산술에는 가장 적은 노력을 소비했습니다추론 모델은 훈련 중 강화 학습을 통해 향상된 성능을 달성하는데, 정답에 대해서는 보상을 받고 오류에 대해서는 페널티를 받아 문제 공간을 탐색하고 인간의 문제 해결 접근 방식을 반영하는 단계별 솔루션 전략을 개발할 수 있습니다
797 조회
0 추천
2025.11.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입