Loading...

AI 뉴스

Grok, X에 이미지-투-비디오 도구 추가

페이지 정보

작성자 xtalfi
작성일 2025.11.11 14:52
1,505 조회
0 추천
0 비추천

본문

Grok-logo-on-an-Android-phone-with-an-AI-type-background_cpf6o8.jpg

(퍼플렉시티가 정리한 기사)


일론 머스크는 11월 8일 Grok의 새로운 이미지-비디오 애니메이션 기능을 공개했으며, 사용자들이 간단한 길게 누르기 제스처와 맞춤형 텍스트 프롬프트를 통해 정지 사진을 짧은 비디오 클립으로 변환할 수 있게 했다. Grok Imagine 도구로 구동되는 이 기능은 X에 직접 통합되어 사용자들이 플랫폼에서 AI 생성 비디오 콘텐츠를 만들 수 있도록 한다.​

토요일 아침 일찍 X에서 이 도구를 시연하며, 머스크는 정지 이미지에서 생성된 "I will always love you"라고 말하는 여성의 AI 생성 비디오를 게시했다. 그는 나중에 두 사람이 머펫으로 변하는 또 다른 예시를 공유하며 다음과 같이 썼다: "어떤 이미지든 길게 눌러서 비디오로 만드세요! 그런 다음 프롬프트를 맞춤 설정하여 상상할 수 있는 모든 것을 만들어보세요".​


Grok 4 플랫폼과의 통합

비디오 생성 기능은 2025년 10월 버전 0.9로 업그레이드된 xAI의 Grok Imagine 도구를 기반으로 합니다. 이 시스템은 배경 음악, 대화 및 음향 효과를 포함한 동기화된 오디오와 함께 6초에서 15초 범위의 비디오를 생성할 수 있습니다. 보고서에 따르면, Grok Imagine을 구동하는 Aurora 엔진은 평균 약 17초 만에 비디오를 생성하여 Adobe, Google 및 OpenAI의 도구들과 경쟁력 있는 위치를 차지하고 있습니다.​

Grok 4는 2025년 8월 전 세계 모든 사용자에게 무료로 제공되었지만, 무료 등급에는 12시간마다 약 5회의 쿼리 제한을 포함한 사용 제한이 있습니다. 프리미엄 구독자 및 Premium+ 플랜 사용자는 더 빠른 응답 시간, 확장된 컨텍스트 길이 및 고급 SuperGrok 모드에 대한 액세스를 받습니다. 월 $300의 비용이 드는 SuperGrok Heavy 구독은 모델의 최고 성능 버전을 제공합니다.​


경쟁 환경

이번 출시로 xAI는 기존 AI 영상 생성 플랫폼들과 직접적인 경쟁 관계에 놓이게 되었습니다. Adobe는 Firefly 도구를 통해 유사한 이미지-투-비디오 기능을 제공하며, 정지 이미지를 실사 영상으로 변환할 수 있습니다. Google의 Veo 3와 OpenAI의 Sora는 모두 동기화된 오디오와 함께 AI 생성 영상을 제작하지만, 해상도, 길이, 생성 속도 면에서 각기 다른 강점을 가지고 있습니다.​

머스크의 발표 이후, X 사용자들은 빠르게 이 기능을 실험하기 시작했으며, 플랫폼 전반에 걸쳐 AI 생성 클립을 공유했습니다. 이 도구는 X 플랫폼과 Grok의 독립형 모바일 애플리케이션 모두를 통해 이용할 수 있습니다.

댓글 0
전체 1,366 / 26 페이지
OpenAI는 “hazelnuts”라는 코드명의 새로운 “Skills” 기능을 ChatGPT에 테스트 중이며, 이를 통해 사용자는 슬래시 명령어를 통해 맞춤 지시사항에 액세스할 수 있고, Skills 편집기와 맞춤 GPT를 스킬로 변환하는 옵션이 제공되며, 2026년 1월에 출시될 것으로 예상됩니다.Skills는 AI 시스템에 특정 능력과 워크플로우를 가르치는 폴더 기반 지시사항으로, 12월 18일 agentskills.io에서 Anthropic이 공개한 오픈 스탠다드를 따르며, OpenAI는 이미 지난주 자사의 Codex 코딩 에이전트에 이를 조용히 도입했습니다.Microsoft, GitHub, 그리고 Cursor와 Goose를 포함한 인기 있는 코딩 에이전트들은 이미 Agent Skills 표준을 통합했으며, 이는 여러 스킬을 효율적으로 함께 쌓을 수 있는 이 접근 방식의 광범위한 업계 채택을 나타냅니다.
774 조회
0 추천
2025.12.25 등록
OpenAI의 GPT-5.2는 실제 테스트에서 이전 버전 대비 미미한 개선만을 제공한 반면, Google의 Gemini 3는 Nano Banana Pro 모델을 통해 속도, 창의적 글쓰기, 이미지 생성에서 명확하게 눈에 띄는 발전을 보여주었습니다.경쟁 압박으로 인해 OpenAI CEO Sam Altman은 Gemini 3의 출시가 다양한 성능 지표에서 GPT-5.1을 능가한 후, 직원들에게 즉각적인 ChatGPT 개선을 우선시하도록 지시하는 “코드 레드” 지침을 발령했습니다.GPT-5.2의 API 가격은 GPT-5.1 대비 40% 인상된 반면, Gemini 3는 더 저렴한 가격을 유지하면서 일반 사용자들이 더 쉽게 알아차릴 수 있는 복잡한 추론 작업에서 일관되게 더 빠르고 정확한 응답을 제공했습니다.
746 조회
0 추천
2025.12.25 등록
OpenAI는 화요일에 2026년까지 인공 일반 지능에 도달하는 것은 더 강력한 모델을 개발하는 것만큼이나 사용자가 AI를 효과적으로 채택하도록 돕는 것에 달려 있다고 발표했으며, AI가 할 수 있는 것과 대부분의 사람들이 실제로 사용하는 것 사이에 “능력 격차”가 있다고 지적했다.이 회사의 전환은 조사 대상 근로자의 75%가 AI가 속도나 품질을 향상시켜 매일 40~60분을 절약한다고 보고하는 데이터 가운데 이루어졌지만, 일반 직원보다 6배 많은 AI 메시지를 보내는 “선도” 사용자들과의 격차가 존재한다.OpenAI의 2026년 로드맵은 이제 의료, 비즈니스 운영 및 일상생활에서 “배포 격차”를 줄이는 것을 강조하며, 케냐 파트너십과 같은 실제 배포를 통해 39,849건의 환자 방문에서 진단 오류를 16% 감소시켰다.
767 조회
0 추천
2025.12.25 등록
웨어러블 AI 시장은 원격의료 플랫폼과의 통합으로 지속적인 건강 모니터링과 예측 진단이 가능해지면서 2025년 363억 8천만 달러에서 2030년 658억 달러로 연평균 12.4%의 성장률로 증가할 것으로 예상됩니다.삼성전자는 Galaxy Ring에 전고체 배터리 기술을 적용하여 연중무휴 의료급 모니터링을 구현하고 있으며, Philips와 Masimo는 실시간 환자 데이터를 위해 무선 센서를 임상 모니터링 대시보드에 통합하는 파트너십을 맺었습니다.Apple과 Alphabet은 각각 HealthKit 생태계와 Gemini AI 기반 Fitbit을 통해 경쟁하고 있으며, DexCom은 연속 혈당 모니터링을 위한 최초의 생성형 AI 플랫폼을 출시했고, FDA는 의료 관련 주장에 대한 규제 심사를 강화하고 있습니다.
787 조회
0 추천
2025.12.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입