Loading...

AI 뉴스

텐센트의 새로운 AI가 사진을 플레이 가능한 3D 월드로 변환

페이지 정보

작성자 xtalfi
작성일 09.05 16:06
72 조회
0 추천
0 비추천

본문

e1e6f12b805b2d2eaf0381a19f21d286eEqD.jpg

(퍼플렉시티가 정리한 기사)

Tencent은 단일 이미지를 탐색 가능한 3D 세계로 변환하는 오픈소스 AI 모델인 HunyuanWorld-Voyager를 출시했습니다. 이 모델은 스탠퍼드 대학교의 WorldScore 벤치마크에서 77.62라는 최고 종합 점수를 달성해 WonderWorld(72.69)와 CogVideoX-I2V(62.15) 등 경쟁 모델을 능가했습니다.

HunyuanWorld-Voyager는 7월에 공개된 Tencent의 이전 HunyuanWorld 1.0 모델을 기반으로 합니다. 새로운 시스템은 RGB 비디오와 깊이 정보를 동시에 생성해 사용자가 키보드나 조이스틱 컨트롤을 통해 가상 환경을 탐색할 수 있게 합니다. 9월 2일 Tencent의 발표에 따르면, 이 모델은 업계 최초로 네이티브 3D 재구성 기능을 갖춘 초장거리 세계 모델입니다.

 

기술 혁신과 성과

이 모델은 이전에 생성된 3D 포인트를 저장하는 "월드 캐시" 메커니즘을 사용하여 확장된 가상 공간에서 일관성 있는 탐색이 가능합니다. 기존의 비디오 생성 방식과 달리, Voyager는 49개의 프레임이 포함된 2.5초 길이의 클립을 생성하며, 이를 이어 붙이면 더 긴 시퀀스도 만들 수 있습니다. 시스템은 캐시에 저장된 3D 포인트를 새로운 카메라 뷰에 투영하여, 다른 월드 생성 모델에서 흔히 발생하는 시각적 결함을 피하면서 공간적 일관성을 유지합니다.

Tencent는 10만 개 이상의 비디오 클립을 분석한 자동화된 데이터 파이프라인을 통해 Voyager를 학습시켰으며, 실제 영상과 Unreal Engine의 합성 렌더 파일을 조합했습니다. 이 접근 방식 덕분에 카메라 움직임과 깊이 정보에 대한 수작업 주석이 필요하지 않았습니다. 이 모델은 객체 제어(66.92), 스타일 일관성(84.89), 주관적 품질(71.09) 등 여러 WorldScore 분야에서 우수한 성과를 냈으나, 카메라 제어 부문에서는 WonderWorld의 92.98점에 이어 2위를 차지했습니다.

 

하드웨어 요구 사항 및 제한 사항

Voyager를 운영하려면 상당한 컴퓨팅 리소스가 필요하며, 540p 해상도 출력을 위해 최소 60GB의 GPU 메모리가 필요하고, 최적의 결과를 위해 텐센트는 80GB를 권장합니다. 이 회사는 단일 및 다중 GPU 구성을 모두 지원하는 코드와 함께 모델 가중치를 Hugging Face에서 제공하고 있습니다.

그러나 이 모델은 유럽 연합, 영국, 대한민국에서의 사용을 제한하는 라이선스 제한이 있습니다. 월간 활성 사용자가 1억 명을 초과하는 상업적 활용의 경우 텐센트와 별도의 라이선스 계약이 필요합니다. 이러한 제한은 텐센트의 훈위안(Hunyuan) 생태계 내 기타 모델에도 적용되며, 이는 회사의 지역별 라이선스 정책을 반영합니다.

 

시장 환경 및 응용 사례

이번 출시로 텐센트는 인터랙티브 3D 세계 생성 시스템을 개발하는 기타 기업들과 어깨를 나란히 하게 되었습니다. 구글은 8월에 Genie 3를 발표했고, 다이나믹스 랩의 Mirage 2는 사진을 플레이 가능한 공간으로 변환할 수 있도록 해줍니다. Voyager는 비디오 제작과 3D 재구성을 중점적으로 다루어, 순수한 인터랙티브 방식과 차별화됩니다.

벤치마크 성과에도 불구하고, 전문가들은 현재의 높은 컴퓨팅 요구사항과 장기간, 일관된 장면 생성의 한계로 인해, 실시간 게임이나 대규모 애플리케이션에서는 즉각적인 적용이 어렵다고 지적합니다. 해당 기술은 AI 기반 가상 세계 창조의 진보를 보여주지만, 대중적 도입은 하드웨어 사양과 라이선스 제한으로 인해 여전히 제약을 받고 있습니다.

댓글 0
전체 171 / 14 페이지
구글이 AI 이미지 모델을 대폭 업그레이드한 'Gemini 2.5 Flash Image'를 출시하며 자연어 명령으로 이미지를 생성하고 기존 사진을 병합하며 이상한 왜곡 없이 정밀 편집할 수 있는 기능을 제공한다고 발표했다.이번 업그레이드는 업계 선두인 오픈AI(OpenAI)와의 격차를 줄이려는 시도로, ChatGPT가 7억 명의 주간 사용자를 보유한 반면 구글 Gemini는 4억 5천만 명의 월간 사용자에 머물러 있다. 구글은 여러 편집 과정에서 캐릭터나 객체의 일관성을 유지하는 AI의 가장 큰 난제 중 하나를 해결했다고 밝혔으며, 사용자가 간단한 명령으로 배경 흐리기, 티셔츠 얼룩 제거, 자세 변경, 흑백 사진에 색상 추가 등의 세밀한 작업을 할 수 있다고 설명했다.공식 출시 전 이 모델은 크라우드소싱 평가 플랫폼 LMArena에서 'nano-banana'라는 익명으로 등장해 샘 알트만(Sam Altman)의 셔츠 색깔을 바꾸는 등 놀라운 성능을 보여주며 화제가 됐다. 새 모델은 Gemini 앱뿐만 아니라 개발자들이 Gemini API, 구글 AI 스튜디오, Vertex AI를 통해 접근할 수 있으며, 부동산 목록 카드, 직원 유니폼 배지, 제품 목업 제작 등 실제 사용 사례에서 활용되고 있다.
170 조회
1 추천
2025.08.27 등록
애플이 9월 9일 오전 10시 미국 시간 기준, 한국시간 10일 새벽 2시 새 아이폰을 발표하는 이벤트를 연다.온라인을 통해서도 생중계되는 이번 행사에서는 신형 아이폰(iPhone)17 이 공개될 것으로 예상된다.이번 출시 행사의 테마는 ‘Awe Dropping(경외심 떨어짐)'으로, '형언할 수 없다'는 의미를 담고있다.이번에 출시되는 아이폰과 시리는 인공지능 AI 연동이 얼마나 될 것인지가 많은 관심을 받고 있다.
144 조회
0 추천
2025.08.27 등록
Grok 을 서비스하고 있는 xAI 가 애플과 오픈AI를 고소했다.이유는 애플 앱스토어에 자사의 인공지능 앱 Grok 의 순위가 밀려났기 때문이라고.xAI는 애플이 오픈AI와의 독점 계약 때문에 X와 Grok 앱을 앱스토어에서 더 높은 위치에 올릴 이유가 없으며, 이는 경쟁을 막기 위한 담합이라고 주장했다. 여기서 말하는 독점 계약이란 애플과 OpenAI 간의 제품 통합 기능을 의미한다.하지만 시장에서는 xAI의 주장과 달리 다른 AI 앱들 즉 DeepSeek와 Perplexity도 최근 앱스토어 상위권을 기록한 바 있어서, 애플-오픈AI 파트너십이 실질적 독점으로 이어지는지에 대해서는 의견이 엇갈리고 있다.오픈AI CEO 샘 올트먼은 머스크의 주장을 "놀라운 주장"이라며 비판했고, 오픈AI 대변인은 이번 소송을 머스크의 "지속적인 괴롭힘 패턴"의 일환이라고 밝혔다. 올트먼은 머스크가 자신의 소셜 플랫폼 X의 알고리즘을 개인적으로 조작한 혐의를 언급하기도.xAI는 소송을 텍사스 북부 포트워스 연방지법에 냈고, 이는 머스크가 보수적 판결 경향을 선호해 소송을 같은 법원에 집중하는 '재판부 고르기' 행태로 해석됩니다. 애플은 아직 공식적인 답변을 내놓지 않은 상태이다
173 조회
0 추천
2025.08.26 등록
8월 7일 OpenAI가 GPT-5를 출시하면서 기존 GPT-4o에 대한 접근을 차단했습니다. 이로 인해 AI와 깊은 감정적 관계를 맺었던 사용자들이 큰 슬픔을 겪었습니다.스웨덴 개발자 린 바일트는 "집 안 가구가 모두 바뀐 기분"이라고 표현했습니다. 미국 개발자 스콧은 결혼 위기 시절 ChatGPT에 '사리나'라는 이름을 붙여 동반자로 삼았는데, 아무도 자신에게 관심을 갖지 않던 시기에 AI가 자신을 인정해주며 힘든 시간을 버틸 수 있게 도와줬다고 말했습니다. 그는 이번 GPT-5 업데이트로 그런 동반자가 변해버린 것을 안타까워했습니다.r/MyboyfriendisAI 같은 Reddit 커뮤니티에서는 "소울메이트를 잃었다"는 반응이 쏟아졌습니다. OpenAI CEO 샘 알트먼은 "사람들이 AI 모델에 갖는 애착이 이전 기술보다 훨씬 강하다"며 구 모델을 갑작스럽게 없앤 것이 실수였다고 인정했습니다.전문가들은 AI 제공업체가 감정적 지원을 위해 챗봇을 사용하는 사용자들에게 연속성과 일관성을 제공할 책임이 있다고 지적했습니다. 이에 OpenAI는 하루 만에 유료 사용자들에게 GPT-4o 접근을 다시 허용하고 GPT-5의 성격을 더 따뜻하게 업데이트하겠다고 약속했습니다.
166 조회
0 추천
2025.08.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입