Lightricks, 오픈소스 AI 비디오 모델 LTX-2 출시

xtalfi

13:41

runnitResults_users_33LfEDdxlyZufi5rhbzABHFSLNT2_runs_muSXtR72nafQKuxujb3n_S_m0bp1PtpWpF5WZ_8fR0-1.jpg

(퍼플렉시티가 정리한 기사)

Lightricks는 수요일에 LTX-2를 공개하면서, 전문가 수준의 동기화된 오디오 및 비디오 콘텐츠를 생성할 수 있는 최초의 완전 오픈 소스 AI 비디오 기반 모델이라고 주장했습니다. 이 시스템은 최대 10초 길이의 시퀀스에 대해 50프레임/초의 네이티브 4K 해상도 영상을 생성하며, 소비자용 그래픽 카드에서도 효율적으로 작동합니다.

셀카 편집 앱 Facetune으로 잘 알려진 예루살렘 소재 회사인 Lightricks는 실험적 기술과 제작 준비가 된 도구 사이의 격차를 해소하는 창의적 AI의 혁신으로 LTX-2를 내세우고 있습니다. Lightricks에 따르면, 이 모델은 약 5초 만에 6초 길이의 Full HD 비디오를 생성할 수 있으며, 이로 인해 비슷한 결과물을 생성하는 데 일반적으로 1~2분이 걸리는 OpenAI의 Sora 2와 같은 경쟁 업체를 크게 앞질렙니다.

속도와 효율성이 시장 차별화를 이끈다

LTX-2의 주요 경쟁력은 처리 속도와 비용 효율성에 있습니다. 회사 측은 이 모델이 멀티-GPU 추론 스택을 통해 경쟁 시스템보다 최대 50% 낮은 연산 비용으로 전문적인 결과를 제공한다고 주장합니다. 이러한 효율성은 하드웨어 요구 사항에도 확대되어, 엔터프라이즈급 인프라가 아닌 일반 소비자용 GPU에서도 구동이 가능합니다.

“확산 모델은 더 이상 단순히 생산을 시뮬레이션하는 수준에 머무르지 않고, 곧 실제 생산 그 자체가 되고 있습니다,”라고 Lightricks의 공동 창립자이자 CEO인 Zeev Farbman은 말했습니다. “LTX-2는 이러한 변화의 대표적 모델입니다: 우리가 만든 가장 완성도 높은 크리에이티브 엔진으로, 동기화된 오디오와 비디오, 4K 고화질, 장편 제작 역량, 획기적인 효율성을 하나의 오픈된 실제 생산 시스템으로 통합했습니다.”

이 모델은 세 가지 가격 책정 옵션을 제공합니다: 빠른 반복 작업을 위한 Fast는 초당 $0.04, 일상적인 제작 작업을 위한 Pro는 초당 $0.08, 4K 해상도와 동기화된 오디오로 최대 품질 출력을 위한 Ultra는 초당 $0.16입니다. 가격은 해상도(720p~4K)와 오디오 생성 포함 여부에 따라 달라집니다.

오픈 소스 전략이 업계 리더들에게 도전 과제를 안겨준다

LTX-2의 오픈소스 접근 방식은 대형 기술 기업의 독점 모델이 지배하는 시장에서 차별성을 보여줍니다. OpenAI의 Sora 2와 Google의 Veo 3.1이 각각의 역량으로 주목을 받고 있지만, 두 시스템 모두 접근이 제한된 폐쇄형 시스템으로 남아 있습니다. LTX-2의 핵심 구성 요소는 이미 GitHub에 공개되어 있으며, 전체 모델 가중치와 학습 데이터셋은 올 가을 말에 공개될 예정입니다.

이 모델의 오디오-비디오 동기화 생성 기능은 오디오를 따로 제작하고 후처리로 통합해야 하는 기존 시스템에 비해 기술적 진보를 이룹니다. LTX-2는 영상, 움직임, 대사, 환경음, 음악을 하나의 과정에서 동시에 만들어내며, 영화 제작자와 콘텐츠 제작자를 위한 창작 작업 흐름을 간소화합니다.

LTX-2의 API 접근은 현재 Fal, Replicate, ComfyUI 등 플랫폼과의 통합을 통해 초기 파트너들에게 순차적으로 제공되고 있습니다. 또한 Lightricks의 LTX Studio 플랫폼을 통해서도 접근이 가능하며, 더 넓은 마켓플레이스에서의 출시도 올해 후반기에 예정되어 있습니다. 2013년에 설립된 Lightricks는 지금까지 3억 3,500만 달러의 자금을 조달했으며, 2021년 기준 18억 달러의 기업 가치를 달성했습니다.