Loading...

AI 뉴스

텐센트의 새로운 AI가 사진을 플레이 가능한 3D 월드로 변환

페이지 정보

작성자 xtalfi
작성일 2025.09.05 16:06
1,625 조회
0 추천
0 비추천

본문

e1e6f12b805b2d2eaf0381a19f21d286eEqD.jpg

(퍼플렉시티가 정리한 기사)

Tencent은 단일 이미지를 탐색 가능한 3D 세계로 변환하는 오픈소스 AI 모델인 HunyuanWorld-Voyager를 출시했습니다. 이 모델은 스탠퍼드 대학교의 WorldScore 벤치마크에서 77.62라는 최고 종합 점수를 달성해 WonderWorld(72.69)와 CogVideoX-I2V(62.15) 등 경쟁 모델을 능가했습니다.

HunyuanWorld-Voyager는 7월에 공개된 Tencent의 이전 HunyuanWorld 1.0 모델을 기반으로 합니다. 새로운 시스템은 RGB 비디오와 깊이 정보를 동시에 생성해 사용자가 키보드나 조이스틱 컨트롤을 통해 가상 환경을 탐색할 수 있게 합니다. 9월 2일 Tencent의 발표에 따르면, 이 모델은 업계 최초로 네이티브 3D 재구성 기능을 갖춘 초장거리 세계 모델입니다.

 

기술 혁신과 성과

이 모델은 이전에 생성된 3D 포인트를 저장하는 "월드 캐시" 메커니즘을 사용하여 확장된 가상 공간에서 일관성 있는 탐색이 가능합니다. 기존의 비디오 생성 방식과 달리, Voyager는 49개의 프레임이 포함된 2.5초 길이의 클립을 생성하며, 이를 이어 붙이면 더 긴 시퀀스도 만들 수 있습니다. 시스템은 캐시에 저장된 3D 포인트를 새로운 카메라 뷰에 투영하여, 다른 월드 생성 모델에서 흔히 발생하는 시각적 결함을 피하면서 공간적 일관성을 유지합니다.

Tencent는 10만 개 이상의 비디오 클립을 분석한 자동화된 데이터 파이프라인을 통해 Voyager를 학습시켰으며, 실제 영상과 Unreal Engine의 합성 렌더 파일을 조합했습니다. 이 접근 방식 덕분에 카메라 움직임과 깊이 정보에 대한 수작업 주석이 필요하지 않았습니다. 이 모델은 객체 제어(66.92), 스타일 일관성(84.89), 주관적 품질(71.09) 등 여러 WorldScore 분야에서 우수한 성과를 냈으나, 카메라 제어 부문에서는 WonderWorld의 92.98점에 이어 2위를 차지했습니다.

 

하드웨어 요구 사항 및 제한 사항

Voyager를 운영하려면 상당한 컴퓨팅 리소스가 필요하며, 540p 해상도 출력을 위해 최소 60GB의 GPU 메모리가 필요하고, 최적의 결과를 위해 텐센트는 80GB를 권장합니다. 이 회사는 단일 및 다중 GPU 구성을 모두 지원하는 코드와 함께 모델 가중치를 Hugging Face에서 제공하고 있습니다.

그러나 이 모델은 유럽 연합, 영국, 대한민국에서의 사용을 제한하는 라이선스 제한이 있습니다. 월간 활성 사용자가 1억 명을 초과하는 상업적 활용의 경우 텐센트와 별도의 라이선스 계약이 필요합니다. 이러한 제한은 텐센트의 훈위안(Hunyuan) 생태계 내 기타 모델에도 적용되며, 이는 회사의 지역별 라이선스 정책을 반영합니다.

 

시장 환경 및 응용 사례

이번 출시로 텐센트는 인터랙티브 3D 세계 생성 시스템을 개발하는 기타 기업들과 어깨를 나란히 하게 되었습니다. 구글은 8월에 Genie 3를 발표했고, 다이나믹스 랩의 Mirage 2는 사진을 플레이 가능한 공간으로 변환할 수 있도록 해줍니다. Voyager는 비디오 제작과 3D 재구성을 중점적으로 다루어, 순수한 인터랙티브 방식과 차별화됩니다.

벤치마크 성과에도 불구하고, 전문가들은 현재의 높은 컴퓨팅 요구사항과 장기간, 일관된 장면 생성의 한계로 인해, 실시간 게임이나 대규모 애플리케이션에서는 즉각적인 적용이 어렵다고 지적합니다. 해당 기술은 AI 기반 가상 세계 창조의 진보를 보여주지만, 대중적 도입은 하드웨어 사양과 라이선스 제한으로 인해 여전히 제약을 받고 있습니다.

댓글 0
전체 1,224 / 274 페이지
애플이 인공지능 및 로보틱스 핵심 인재를 메타와 경쟁사에 잇달아 빼앗기고 있다고 블룸버그가 보도.애플의 로보틱스 AI 연구 책임자 Jian Zhang이 메타(Meta)로 이직했으며, 지난 1월 이후 12명 이상의 AI 전문가가 애플을 떠나 메타, OpenAI, Anthropic 등 경쟁사로 이동했다메타는 뛰어난 인공지능 인재 확보를 위해 업계 최고 수준의 보상 패키지를 제시하고 있으며, 대표적으로 Foundational Models 팀장 Ruoming Pang은 2억 달러 규모의 연봉 패키지로 메타로 자리를 옮겼다Zhang이 이끌던 팀은 애플의 로봇 가상 동반자 개발 그룹과는 별개로, 제품 자동화와 AI 기술 적용을 연구하고 있었다.애플은 Siri의 AI 역량 강화를 위해 OpenAI, Anthropic, 구글 등과 파트너십을 논의 중이지만, 내부 잡음과 함께 추가적인 인력 이탈이 지속되고 있
1749 조회
0 추천
2025.09.03 등록
한국이 2025년 9월 한 달간 유엔 안전보장이사회 의장국을 수임한다고 외교부가 3일 발표했습니다. 안보리 의장국은 한 달 동안 안보리를 대표하며 회의를 소집하고 주재할 권한을 갖게 됩니다. 특히 9월은 전 세계 정상급 인사들이 뉴욕에 모이는 유엔총회 고위급회기가 열리는 시기여서 이번 의장국 수임의 의미가 더욱 큽니다.한국은 2024년부터 2025년까지 안보리 이사국 임기를 수행하고 있으며, 지난해 6월에 이어 이번이 두 번째 의장국 수임입니다. 정부는 의장국 대표행사로 9월 24일 이재명 대통령 주재 하에 '인공지능과 국제 평화와 안보'를 주제로 한 공개토의를 개최할 예정입니다. 한국 대통령이 유엔 안보리 의장으로서 안보리 회의를 직접 주재하는 것은 이번이 처음입니다.이번 AI 관련 회의에서는 급속하게 발전하는 인공지능 기술이 국제 평화와 안보에 미칠 기회와 도전을 논의하고, 이에 대한 국제사회의 대응 방안을 모색할 예정입니다. 회의에는 안보리 이사국을 포함한 모든 유엔 회원국이 참여할 수 있습니다. 또한 정부는 안보리 이사국으로서 중점 추진 중인 의제 중 하나인 유엔 평화 활동을 주제로 한 공개토의를 9월 9일 개최할 계획입니다.9월 한 달간 안보리는 이스라엘-팔레스타인, 시리아, 예멘, 콩고민주공화국, 아프가니스탄 등 지역의 평화와 안보를 확보하기 위한 방안을 논의할 예정입니다. 외교부는 전 세계의 이목이 유엔에 집중되는 9월, 우리나라의 안보리 의장국 수임이 다자무대에서 가시성을 높일 수 있는 중요한 기회라며, 이번 기회를 통해 국제 평화와 안보 분야에서 리더십을 발휘하고 글로벌 책임 강국으로서 위상을 제고해 나갈 것이라고 밝혔습니다.
1685 조회
0 추천
2025.09.03 등록
앱 리서치 회사 와이즈앱의 발표에 따르면 한국 ChatGPT 사용자수가 월 2천만명을 넘어섰다고 한다.사용자 층을 세부적으로 살펴보면 20대가 24.2%, 30대가 22.0%, 40대가 22.4%로 도합 68.6%를 차지해 가장 높은 비중을 보였다. 청년 세대가 생성형 AI 기술을 가장 활발하게 수용하고 활용하는 연령대임이 명확히 드러난 셈이다.그 뒤를 이어 20세 미만이 13.6%, 50대가 12.6%, 60세 이상이 5.2% 순으로 나타나 중장년층과 청소년층에서도 꾸준한 이용 흐름이 관찰됐다. 성별 사용자 비율은 남성 50.1%, 여성 49.9%로 거의 차이가 없어 성별에 관계없이 고르게 사용되는 것으로 분석됐다.
1711 조회
1 추천
2025.09.02 등록
(퍼플렉시티로 기사 내용을 요약함)## AI의 물 사용 구조AI 시스템은 답변 한 번당 상당한 양의 **물**을 소비합니다. 대표적으로 GPT-3 기준, 짧은 대화 한 번에 약 500ml의 물이 사용됩니다[1]. 이는 데이터센터의 서버 냉각과 전기를 생산하는 발전소에서 소비되는 물 모두를 합산한 수치입니다.- 첫 번째 흐름: 서버 냉각을 위한 현장 내 물 사용- 두 번째 흐름: 전기 생산 발전소에서의 물 사용[1]## 위치, 기후, 시간의 효과데이터센터의 위치와 기후에 따라 **물 사용량**이 크게 달라집니다. 예를 들어, 시원하고 습한 아일랜드의 센터는 외부공기 냉각을 주로 사용해 물 사용이 적으며, 반면 뜨겁고 건조한 애리조나에서는 증발 냉각이 많이 적용되어 대량의 물이 소모됩니다[1]. 계절과 주야에 따라 냉각 효율과 물 소모도 변화합니다.## 새로운 냉각 기술- 서버를 비전도성 액체에 담그는 침수 냉각(immersion cooling)- 마이크로소프트의 물 비사용 냉각 설계(특수 액체 순환식 등)[1]이런 기술들은 아직 도입 단계이거나 비용, 유지보수, 기존 센터 전환의 어려움으로 널리 쓰이지 않습니다.## AI 물 발자국 계산법1. 신뢰할 만한 출처에서 모델별 전력 소모량(Wh)을 찾는다.2. 전력 1Wh 당 물 사용량(1.3~2.0ml/Wh 범위 추정치)을 적용한다.3. 두 수치를 곱한다[1].예시: GPT-5의 150~200자 응답은 19.3Wh, GPT-4o는 1.75Wh.- 보수적으로 2ml/Wh 적용 시- GPT-5: 39ml/응답- GPT-4o: 3.5ml/응답## 전체 규모 및 비교- GPT-4o 처리 기준 하루 약 880만리터, GPT-5는 약 9,750만리터의 물이 소모됩니다.- 이는 미국 일상 생활 물 사용(예: 정원 관수 340억리터/일)에 비해 상대적으로 적지만, 향후 쿨링 효율, AI 설계, 전력 구조 개선에 따라 변동 가능성이 큽니다[1].## 결론 및 대안- AI 시스템의 물 사용량은 데이터센터의 위치, 냉각 방식, 전력 구조, AI 모델의 효율성 등에 따라 크게 달라집니다.- 효율적인 서버, 재생에너지, 친환경 냉각 방식을 도입하면 물 소모를 최소화할 수 있습니다.
1667 조회
0 추천
2025.09.02 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입