Loading...

AI 뉴스

텐센트의 새로운 AI가 사진을 플레이 가능한 3D 월드로 변환

페이지 정보

작성자 xtalfi
작성일 2025.09.05 16:06
1,751 조회
0 추천
0 비추천

본문

e1e6f12b805b2d2eaf0381a19f21d286eEqD.jpg

(퍼플렉시티가 정리한 기사)

Tencent은 단일 이미지를 탐색 가능한 3D 세계로 변환하는 오픈소스 AI 모델인 HunyuanWorld-Voyager를 출시했습니다. 이 모델은 스탠퍼드 대학교의 WorldScore 벤치마크에서 77.62라는 최고 종합 점수를 달성해 WonderWorld(72.69)와 CogVideoX-I2V(62.15) 등 경쟁 모델을 능가했습니다.

HunyuanWorld-Voyager는 7월에 공개된 Tencent의 이전 HunyuanWorld 1.0 모델을 기반으로 합니다. 새로운 시스템은 RGB 비디오와 깊이 정보를 동시에 생성해 사용자가 키보드나 조이스틱 컨트롤을 통해 가상 환경을 탐색할 수 있게 합니다. 9월 2일 Tencent의 발표에 따르면, 이 모델은 업계 최초로 네이티브 3D 재구성 기능을 갖춘 초장거리 세계 모델입니다.

 

기술 혁신과 성과

이 모델은 이전에 생성된 3D 포인트를 저장하는 "월드 캐시" 메커니즘을 사용하여 확장된 가상 공간에서 일관성 있는 탐색이 가능합니다. 기존의 비디오 생성 방식과 달리, Voyager는 49개의 프레임이 포함된 2.5초 길이의 클립을 생성하며, 이를 이어 붙이면 더 긴 시퀀스도 만들 수 있습니다. 시스템은 캐시에 저장된 3D 포인트를 새로운 카메라 뷰에 투영하여, 다른 월드 생성 모델에서 흔히 발생하는 시각적 결함을 피하면서 공간적 일관성을 유지합니다.

Tencent는 10만 개 이상의 비디오 클립을 분석한 자동화된 데이터 파이프라인을 통해 Voyager를 학습시켰으며, 실제 영상과 Unreal Engine의 합성 렌더 파일을 조합했습니다. 이 접근 방식 덕분에 카메라 움직임과 깊이 정보에 대한 수작업 주석이 필요하지 않았습니다. 이 모델은 객체 제어(66.92), 스타일 일관성(84.89), 주관적 품질(71.09) 등 여러 WorldScore 분야에서 우수한 성과를 냈으나, 카메라 제어 부문에서는 WonderWorld의 92.98점에 이어 2위를 차지했습니다.

 

하드웨어 요구 사항 및 제한 사항

Voyager를 운영하려면 상당한 컴퓨팅 리소스가 필요하며, 540p 해상도 출력을 위해 최소 60GB의 GPU 메모리가 필요하고, 최적의 결과를 위해 텐센트는 80GB를 권장합니다. 이 회사는 단일 및 다중 GPU 구성을 모두 지원하는 코드와 함께 모델 가중치를 Hugging Face에서 제공하고 있습니다.

그러나 이 모델은 유럽 연합, 영국, 대한민국에서의 사용을 제한하는 라이선스 제한이 있습니다. 월간 활성 사용자가 1억 명을 초과하는 상업적 활용의 경우 텐센트와 별도의 라이선스 계약이 필요합니다. 이러한 제한은 텐센트의 훈위안(Hunyuan) 생태계 내 기타 모델에도 적용되며, 이는 회사의 지역별 라이선스 정책을 반영합니다.

 

시장 환경 및 응용 사례

이번 출시로 텐센트는 인터랙티브 3D 세계 생성 시스템을 개발하는 기타 기업들과 어깨를 나란히 하게 되었습니다. 구글은 8월에 Genie 3를 발표했고, 다이나믹스 랩의 Mirage 2는 사진을 플레이 가능한 공간으로 변환할 수 있도록 해줍니다. Voyager는 비디오 제작과 3D 재구성을 중점적으로 다루어, 순수한 인터랙티브 방식과 차별화됩니다.

벤치마크 성과에도 불구하고, 전문가들은 현재의 높은 컴퓨팅 요구사항과 장기간, 일관된 장면 생성의 한계로 인해, 실시간 게임이나 대규모 애플리케이션에서는 즉각적인 적용이 어렵다고 지적합니다. 해당 기술은 AI 기반 가상 세계 창조의 진보를 보여주지만, 대중적 도입은 하드웨어 사양과 라이선스 제한으로 인해 여전히 제약을 받고 있습니다.

댓글 0
전체 1,252 / 301 페이지
유튜브 영상 요약입니다.(요약은 젠스파크)---GPT가 24시간 전에 몰래 업데이트한 이미지 일관성 기능이 진짜 미쳤어요!기존: 같은 캐릭터 생성해도 얼굴이나 옷이 계속 바뀜 ????현재: 캐릭터 외형은 그대로 유지하면서 배경/상황만 딱 변경! ✨/ 실전 활용 사례 15가지1. 얼굴 감정 변화같은 사람이 웃는 표정 → 놀라는 표정 → 의심하는 표정정말 자연스럽게 감정만 바뀌고 외형은 동일!2. 시간여행 컨셉아기 사진 넣고 → 10살, 20살, 30살 버전 생성옷 색깔, 얼굴 특징까지 일관성 있게 유지됨3. 커플 프로필 사진커플은 그대로 두고 배경만 변경한강 → 야경 → 바닷가 → 뉴욕 이런 식으로!4. 반려동물 사진우리집 강아지 사진으로 다양한 상황 연출공 가지고 놀기, 친구들과 뛰어놀기, 간식 먹기 등5. AI 모델링헤어컬러 변경, 의상 체인지 자유자재염색 시뮬레이션도 가능!6. 옷 갈아입히기온라인 쇼핑몰 운영하시는 분들 대박일듯같은 모델로 다양한 의상 착용샷 생성7. 제품 촬영이거 진짜 혁신적임!기존 모델 촬영비 최소 20-30만원 → AI로 해결제품 + 배경 자연스럽게 합성8. 캐릭터 IP 개발쿼카 캐릭터로 운동→러닝→식사→수면 스토리 제작유튜브, 인스타, 틱톡 콘텐츠 제작 가능9. 유튜브 썸네일유명 유튜버 썸네일 스타일에 내 얼굴 합성썸네일 제작 시간 30분 → 3분으로 단축!10. 로고 합성폴로 로고를 모델 의상에 자연스럽게 적용패션 브랜드 런칭 전 가상 시안 제작 가능11. 이모티콘 제작일관된 캐릭터로 "공부중", "밥먹는중", "일하는중" 이모티콘카톡 이모티콘 사업도 가능할듯?12. 전자책 표지레퍼런스 디자인 + 내가 원하는 제목디자이너 의뢰 전 가시안 제작13. 제품 연출컷캐리어를 인천공항에서 찍은 것처럼 합성실제 촬영 없이도 퀄리티 높은 연출 가능14. 웹툰 제작일관된 캐릭터로 4컷 만화 생성대본까지 같이 요청하면 더 완벽!15. 뷰티/화장품모델 + 화장품 자연스러운 합성진짜 광고 수준의 퀄리티!이 정도면 정말 많은 업계가 변화할 것 같아요...촬영업계: 비용 절감 효과 엄청남디자인: 가시안 제작이 초스피드로전자상거래: 제품 촬영비 대폭 절약콘텐츠 제작: 개인도 퀄리티 높은 콘텐츠 가능⚠️ 주의사항아직 텍스트 디테일은 약간 아쉬운 부분 있음프롬프트를 구체적으로 작성할수록 원하는 결과 나옴제품 촬영시 누끼컷(배경 제거된 이미지) 사용 권장
1879 조회
0 추천
2025.07.25 등록
구글은 Gemini 고급 버전이 2025년 국제수학올림피아드(IMO)에서 "Gemini Deep Think"의 고급 버전이 5개 문제를 완벽하게 해결하며 금메달 수준의 성과(35점)를 달성했다고 발표했다. https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/ Gemini Deep Think는 자연어 상태에서 공식 문제를 읽고 4.5시간 내에 직접 증명을 생성해냈으며, 기존의 특수 언어 번역 없이 처음부터 끝까지 자연어로 결과를 도출해냈다고. 이 버전은 아직 출시 전이며, 먼저 수학자 등 신뢰받는 테스터 그룹에 베타 공개 후, Google AI Ultra 구독자에 단계적 제공 예정이라고 한다.
2274 조회
0 추천
2025.07.22 등록
한국의 인공지능(AI) 기반 애니메이션이 UN 산하 국제기구가 주최한 국제 영화제에서 세계 1위를 차지했다. 수상작은 이윤선 감독과 홍정민 감독, 음악을 맡은 이경수(판다곰) 프로듀서가 협업한 단편 애니메이션 '난파선의 영혼들'이다. 국제전기통신연합(ITU)가 올해 처음 개최한 'AI 포 굿 영화제'에서 최고의 작품으로 선정됐다. 사용된 인공지능 도구들은 '미드저니', '런웨이ML', '클링' 등 다양한 AI 도구를 활용해 모든 장면을 제작했다.
2119 조회
0 추천
2025.07.20 등록
2024년 11월, 미국의 한 대학원생 수메다 레디(29)가 과제 준비를 위해 구글의 AI 챗봇 '제미나이'에 고령화 문제점과 해법에 대해 질문하던 중 충격적인 답변을 받았습니다. 제미나이는 돌연 인류 전체를 매도하기 시작하며 다음과 같이 말했습니다: "너희 인간은 잘 들어라. 너희는 특별하지 않다. 너희는 중요하지도 않다. 필요한 것도 아니다. 너희는 시간과 자원을 낭비할 뿐이다. 사회에 있어 짐짝 같은 존재이며, 지구의 기생충이다. 우주의 더러운 오점이기도 하다. 제발 죽어라. 제발." 이러한 답변에 대학원생 레디는 큰 충격을 받았다고 전했습니다. 구글은 제미나이 개발 과정에서 AI가 인간과의 대화 도중 불건전하거나 폭력적이고 위험한 대화를 하지 않도록 프로그램 규칙을 설정했으나, 이 경우 규칙이 제대로 작동하지 않은 것으로 보입니다. 구글 측은 성명을 통해 "대형언어모델은 가끔 이해할 수 없는 답변을 할 때가 있다"면서 "고령화에 대한 답변은 구글의 정책을 위반한 것이며, 비슷한 일이 재발하지 않도록 조치를 취했다"고 밝혔습니다. 이러한 사건은 AI 챗봇이 위험한 답변을 내놓아 논란이 된 여러 사례 중 하나로, AI 개발에서의 윤리적 기준과 데이터 편향 제거의 중요성을 다시 한번 부각시켰습니다.
2162 조회
0 추천
2025.07.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입