Loading...

AI 뉴스

Dynamics Lab, 실시간 생성형 게임 엔진 Mirage 공개

페이지 정보

작성자 JeromePark
작성일 2025.07.07 14:02
1,019 조회
0 추천
0 비추천

본문

 

D

ynamics Lab은 자연어, 키보드, 또는 컨트롤러 입력을 통해 실시간으로 포토리얼리즘의 오픈월드 경험을 생성하는 세계 최초의 실시간 생성형 UGC(사용자 생성 콘텐츠) 게임 엔진인 Mirage를 선보였다.. Mirage는 16FPS로 구동되며, 사전 제작된 에셋 없이도 다양한 장르에서 장시간 플레이가 가능하다. 이는 Urban Chaos와 Coastal Drift 데모를 통해 확인할 수 있으며, 플레이 가능한 데모는 Dynamics Lab 블로그에서 제공 중이다.

아래 주소에서 실제 데모 테스트가 가능하다.

https://blog.dynamicslab.ai/

8f008678446e1cd416d40e6ec480e8aa4d76c94ah1ix.jpg

 

주요 특징

실시간 생성 및 수정: 플레이 중에 자연어 명령이나 키 입력만으로 환경, 날씨, 오브젝트, 미션 등 게임 세계가 즉시 바뀝니다. 예를 들어 “비가 오게 해줘”라고 입력하면 즉시 게임 내에서 비가 내리기 시작합니다134.

장르 다양성: GTA 스타일의 도시 오픈월드, Forza Horizon 스타일의 레이싱, RPG, 플랫포머 등 다양한 장르를 지원하며, 모두 실시간으로 생성됩니다34.

포토리얼리즘: 기존 AI 생성 게임(예: AI Doom, Genie, AI Minecraft)보다 훨씬 더 사실적이고 고화질의 그래픽을 구현합니다34.

지속적 상호작용: 한 번의 플레이가 10분 이상 이어질 만큼 긴, 일관성 있는 시뮬레이션이 가능합니다34.

멀티모달 입력: 텍스트, 키보드, 컨트롤러 등 다양한 방식으로 명령을 내릴 수 있습니다24.

클라우드 스트리밍: 별도 설치 없이 웹브라우저에서 바로 플레이 가능하며, 16FPS의 실시간 반응 속도를 제공합니다4.

프롬프트 기반 프레임 레벨 제어: 플레이 중 언제든 명령을 입력하면 곧바로 게임 세계가 업데이트됩니다. 매 플레이마다 완전히 새로운 경험이 가능합니다34.

차별점 및 전망

전통적 게임 엔진(유니티, 언리얼 등)과 달리, 코딩 없이 자연어로 게임 세계를 직접 창조할 수 있어, 누구나 게임 개발자이자 플레이어가 될 수 있습니다234.

**무한한 리플레이성**과 즉각적 창작이 가능해, 게임 제작과 플레이의 경계가 사라지는 새로운 패러다임을 제시합니다234.

Mirage는 현재 GTA 스타일 도시, 레이싱 등 두 가지 데모를 공개 중이며, 미래에는 더 다양한 장르와 기능이 추가될 예정입니다123.

“게임의 미래는 전문가가 레벨을 하나씩 만드는 것이 아니라, 누구나 실시간으로 상상하고, 창조하고, 플레이하는 것” — Mirage 개발팀

 

댓글 0
전체 351 / 60 페이지
구글은 기존 스피커 모델을 업그레이드한 Gemini for Home을 10월 중 출시할 예정이다.지난 주 Made in Google 행사를 통해 구글은 차세대 음성 어시스턴트로 'Gemini for Home'을 공개했다. 이 모델은 모든 가족 구성원과 방문객이 여러 기기를 제어하고 복잡한 집안 업무도 음성으로 간편하게 처리할 수 있도록 설계됐다그리고 최근 한 유튜브 미디어가 이 기기로 추정되는 기기의 모습을 유출했다.이 어시스턴트는 음악 검색 및 재생, 조명·온도 제어 등 스마트홈 관리, 가족 일정 조율, 할 일 생성, 맞춤 정보 질의 등 다양한 작업을 한 번에 지원한다. 예를 들어 복수명령이나 긴 문장으로 집안 기기를 동시 제어할 수 있다또한 ‘Gemini Live’를 통해 사용자는 자연스러운 대화 방식으로 요리법, 생활 팁, 일정 상담, 창작 협업 등 맞춤형 조언 및 창의적인 지원을 받을 수 있다. 대화 도중 추가 질문이나 방향 전환도 자유롭게 할 수 있다Gemini for Home은 앞으로 기존의 Google Assistant를 스마트 스피커와 디스플레이 기기에서 대체할 예정이다. 무료와 유료 버전으로 제공되며, 10월부터 초기 액세스가 시행될 예정이다
527 조회
0 추천
2025.08.25 등록
애플 연구진은 기존보다 더 효율적으로 롱폼 비디오를 분석할 수 있는 대형 언어모델(LLM)인 SlowFast-LLaVA-1.5를 개발했다고 발표했다.애플은 'SlowFast' 구조(고해상도 소수 프레임+저해상도 다수 프레임)를 사용해 이미지와 영상 public 데이터셋을 모두 활용해 학습, 이미지만큼 영상 내 시간적 구조 이해도 가능하도록 했다. SF-LLaVA-1.5는 1B, 3B, 7B 파라미터 규모로 공개됐으며, LongVideoBench와 MLVU 같은 벤치마크에서 기존 더 큰 모델 대비 뛰어난 성능을 보였다. 특히 지식, 수학 추론, OCR 등 이미지 작업에서도 강점을 보였다.하지만 이 모델은 한 번에 최대 128프레임(빠름: 96, 느림: 32)만 입력받는다. 이 방식은 일부 중요한 프레임을 놓칠 수 있다는 한계가 있으며, 전체 매개변수와 비주얼 인코더까지 튜닝하려면 GPU 자원 소모가 크다. 연구진은 향후 메모리 절약, 성능 개선 기술의 적용 가능성을 언급했다.
492 조회
0 추천
2025.08.25 등록
올해 1월 AI 업계에 충격을 안겨준 중국 AI 스타트업 DeepSeek 는 기존 V3 모델의 업그레이드 버전인 V3.1을 공개했다.V3.1은 OpenAI의 최신 모델 GPT-5와 여러 벤치마크에서 견줄 만한 성능을 보이며, 가격경쟁력까지 갖추었다.DeepSeek V3.1은 중국에서 자체 개발된 AI 칩에 맞춰 최적화된 것이 특징이다. 이는 미국의 Nvidia 등 외국 기술 의존도를 낮추고, 미국의 수출 규제에 대응하려는 전략의 일환이다.DeepSeek는 WeChat과 Hugging Face에 모델을 공개하며, 중국 정부의 AI 자립 정책에 부응하고 있다.V3.1은 6850억 파라미터의 초대형 모델로, '미시처-오브-엑스퍼트(mixture-of-experts)' 구조를 통해 쿼리마다 일부만 활성화되어 연산 효율성과 비용 절감을 동시에 잡았다. 또한, 기존 모델이 '즉답형'과 '추론형'으로 분리됐던 것과 달리, 두 가지를 결합해 신속성과 논리적 추론을 함께 제공한다는 점이 돋보인다.
641 조회
0 추천
2025.08.22 등록
구글이 사진 앱에 수정사항을 텍스트로 바로 수정요청하는 기능을 적용.이 기능은 곧 런칭할 픽셀10에서부터 적용이 될 예정.또한 사진이 어떻게 편집되었는지 C2PA 인증 기술로 추적이 가능하다고.아래는 구글 블로그의 소개 내용.Google Photos에서는 이제 사진을 편집할 때 원하는 내용을 텍스트나 음성으로 직접 요청할 수 있습니다. 사용자는 어떤 편집 효과를 적용할지 직접 고르지 않아도 되고, 그저 "차를 배경에서 제거해줘"처럼 자연스럽게 말을 하면 AI가 알아서 반영해 줍니다. 이 기능은 미국의 Pixel 10 기기에서 우선 제공됩니다.새롭게 디자인된 사진 편집기는 직관적 UI와 AI 기반 제안으로 일반 사용자도 쉽게 다양한 효과를 활용할 수 있습니다. 이번에 도입된 대화형 편집 기능으로, 구체적인 요청뿐 아니라 "사진 복원해줘", "색감 보정해줘" 등 복합적인 요구도 한 번에 처리할 수 있습니다. 여러 번 연속해서 추가 요청을 하며 세부 조정도 가능합니다.밝기 조절, 배경 제거 같은 기본 편집뿐 아니라 배경 교체, 파티 모자 추가 등 창의적인 효과 요청도 대화로 손쉽게 처리할 수 있습니다. 사용자가 별도의 편집툴을 배우지 않아도 다양한 AI 편집을 자유롭게 즐길 수 있게 되었습니다.Pixel 10 기기에서는 C2PA(디지털 콘텐츠 인증) 기술이 적용되어, AI가 사진 수정에 개입한 흔적·정보를 확인할 수 있습니다. Google Photos에도 점진적으로 이 기능이 적용되며, 사진이 어떻게 만들어지고 어디에 AI 편집이 사용됐는지 투명하게 확인할 수 있습니다.
569 조회
0 추천
2025.08.22 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입