AI 뉴스

엔비디아, 로보틱스를 위한 오픈소스 뉴턴 물리 엔진 출시

페이지 정보

작성자 xtalfi
작성일 2025.09.30 04:35
2,982 조회
0 추천
0 비추천

본문

c48fbe67f431fe73900a93d8f50a5e898g01.png

(퍼플렉시티가 정리한 기사)

NVIDIA는 오늘 로보틱스 개발에서 중요한 ’시뮬레이션-현실 간 격차(sim-to-real gap)’를 해소하기 위해 설계된 오픈 소스 물리 엔진인 Newton의 베타 출시를 발표했습니다. 이번 발표는 대한민국 서울에서 열린 로봇 학습 컨퍼런스(CoRL)에서 이루어졌으며, NVIDIA, Google DeepMind, Disney Research 간의 주요 협력을 통해 로봇 학습 및 배포 역량을 가속화하는 중요한 이정표를 의미합니다.

 

로봇 훈련을 위한 혁신적인 성능


현재 NVIDIA Isaac Lab에 통합되어 Linux 재단에서 관리하는 Newton은 로보틱스 시뮬레이션에서 전례 없는 성능 향상을 제공합니다. NVIDIA에 따르면, Newton 내의 MuJoCo Warp 솔버는 GeForce RTX 4090 하드웨어에서 기존 솔루션 대비 보행 작업에서 최대 152배, 조작 작업에서 313배 빠른 성능을 달성했다고 합니다. 최신 NVIDIA RTX PRO 6000 Blackwell 시리즈는 MuJoCo Warp에 추가로 44%의 속도 향상, 그리고 경쟁 프레임워크에 75%의 성능 향상을 더합니다.


“NVIDIA의 Omniverse 및 시뮬레이션 기술 부문 부사장인 레브 레바레디언(Rev Lebaredian)은 ‘휴머노이드는 물리적 AI의 다음 프론티어로, 예측 불가능한 세계에서 사고하고, 적응하며, 안전하게 행동할 능력을 필요로 합니다’라고 말했습니다. ‘이 최신 업데이트들을 통해 개발자들은 이제 연구에서 일상으로 로봇을 가져오는 세 가지 컴퓨터를 얻게 되었습니다. Isaac GR00T가 로봇의 두뇌 역할을, Newton이 신체를 시뮬레이션하며 NVIDIA Omniverse가 훈련장이 됩니다.’”


NVIDIA Warp와 OpenUSD 프레임워크를 기반으로 구축된 Newton은 로봇이 변형 가능한 물체, 천, 모래나 자갈과 같은 입자 물질과 상호 작용할 수 있는 복잡한 다물리 시뮬레이션을 가능하게 합니다. 엔진의 미분 가능한 물리 기능은 그래디언트 기반 최적화를 지원하여, 로봇이 시뮬레이션 데이터를 통해 보다 효과적으로 학습할 수 있도록 합니다.

 

업계 도입은 광범위한 영향을 시사한다


선도적인 로봇 기업들은 이미 개발 워크플로우에 뉴턴(Newton)을 도입하기 시작했습니다. 보스턴 다이내믹스(Boston Dynamics)는 뉴턴의 새로운 정교한 파지(grasping) 워크플로우를 활용하여 아틀라스(Atlas) 로봇의 조작 능력을 향상시켰습니다. 기타 주요 도입 기업으로는 애질리티 로보틱스(Agility Robotics), 피규어 AI(Figure AI), 헥사곤(Hexagon), 스킬드 AI(Skild AI), 솔로몬(Solomon), 테크맨 로봇(Techman Robot) 등이 있습니다.


학계 또한 이 기술을 적극적으로 수용하고 있습니다. 취리히 연방 공과대학교(ETH Zurich) 로봇 시스템 연구실은 뉴턴을 활용해 토공 응용 분야에서 다중물리 시뮬레이션을 수행하고 있으며, 뮌헨 공과대학교(Technical University of Munich)는 실제 로봇에서 검증된 정교한 조작 정책을 실행하는 데 사용하고 있습니다. 베이징대학교(Peking University)는 촉각 센서 솔버 타첼(Taccel)을 뉴턴과 통합하여 시각 기반 촉각 로보틱스의 발전을 도모하고 있습니다.


“뉴턴을 리눅스 재단(Linux Foundation)에 도입하는 것은 협업적 로봇 시뮬레이션을 확장하는 데 있어 중요한 진전입니다. 이는 개발을 가속화하고 비용을 줄이며 심-투-리얼(sim-to-real) 로봇의 미래에 한 걸음 더 다가가게 합니다.“라고 리눅스 재단의 전무 이사 짐 젬린(Jim Zemlin)은 말했습니다.

이 오픈소스 엔진은 로보틱스 분야의 근본적인 과제를 해결합니다. 즉, 가상 환경에서 학습된 기술이 실제 로봇에 성공적으로 이식될 수 있도록 하는 것입니다. 보다 정확한 물리 모델링과 GPU 가속 성능을 제공함으로써, 뉴턴은 개발자들이 실제 환경에서 재현하기엔 지나치게 비용이 많이 들거나, 드물거나, 위험한 시나리오에서 로봇을 훈련할 수 있게 해줍니다. 이는 궁극적으로 엔비디아(NVIDIA)가 일조 달러 규모의 ‘피지컬 AI(physical AI)’ 시장으로 진출하려는 전략을 지원합니다.

댓글 0
전체 1,366 / 280 페이지
(퍼플렉시티가 정리한 기사)일론 머스크는 2025년 10월 6일, xAI의 게임 스튜디오가 2026년 말 이전에 AI가 생성한 비디오 게임을 출시할 것이라고 발표했다. 이는 그의 인공지능 회사가 챗봇을 넘어 대화형 엔터테인먼트로 영역을 대폭 확장하는 이정표가 된다. 이번 발표는 회사가 게임 개발 분야에서 그록(Grok) 챗봇을 훈련시키기 위해 게임 업계 전문가를 적극적으로 영입하고 있는 가운데 나왔으며, AI 기술을 통해 기존의 유명 게임 스튜디오들과 경쟁하려는 전략적 행보를 시사한다.xAI의 게임 분야 야망이 구체화되다이 발표는 머스크의 소셜 미디어 플랫폼 X를 통해 이루어졌으며, 향후 그록이 동적으로 비디오 게임을 생성할 수 있다는 게시물에 대한 응답이었다. “XAI 게임 스튜디오는 내년 말 전에 훌륭한 AI 생성 게임을 출시할 것이다,”라고 머스크는 밝혔다. 이 약속은 머스크가 2024년 11월에 “게임을 다시 위대하게 만들기” 위해 AI 게임 스튜디오를 설립하겠다는 계획을 처음 발표한 이후 거의 1년에 걸친 이니셔티브의 결실을 의미한다.회사는 2025년 7월에 출시된 최신 AI 모델 그록 4를 통해 이미 상당한 진전을 보여주었다. 라이브 데모에서 xAI 엔지니어들은 시스템이 몇 달이 아닌 몇 시간 만에 기능적인 게임을 만들어낼 수 있는 능력을 선보였다. 한 주목할 만한 사례로, 3D 1인칭 슈팅 게임이 그록 4를 사용해 단 4시간 만에 개발되었다. 이 AI는 기본 게임 프레임워크를 생성하고, 텍스처를 찾고, 온라인 소스에서 3D 모델을 가져오는 등 전통적으로 전문 개발자 팀이 맡았던 작업들을 처리할 수 있다.전략적 채용 및 기술 개발xAI는 현재 Grok에게 게임 개념과 메커니즘을 가르치기 위해 시간당 45달러에서 100달러의 경쟁력 있는 보수로 “비디오 게임 튜터”를 모집하고 있습니다. 채용 공고에 따르면, 합격자는 “비디오 게임의 개념, 메커니즘, 그리고 생성에서 Grok이 뛰어나도록 훈련하고 정제함으로써 xAI의 미션에 기여”하게 됩니다. 이 직무는 게임 디자인, 컴퓨터 공학, 또는 인터랙티브 미디어에 대한 전문성을 요구하며, 인디 게임 개발 경험이 있는 지원자를 우대합니다.튜터들은 독점 소프트웨어를 사용해 스토리라인, 메커니즘, 디자인 요소에 대한 피드백을 제공하고, Grok의 게임 출력물을 창의성과 기능성 측면에서 평가하게 됩니다. 근무지는 xAI의 팰로앨토 오피스와 원격 근무 모두 가능하지만, 회사는 원격 직무의 경우 “강한 자기 동기 부여”가 필요하다고 명시하고 있습니다.재정적 맥락과 시장 경쟁xAI를 위한 대규모 모금 활동이 진행되는 가운데 게임 시장 진출이 이루어지고 있습니다. 스페이스X는 50억 달러 규모의 지분 조달 중 20억 달러를 투자하기로 약속했으며, 테슬라 주주들은 2025년 11월 6일 테슬라가 xAI에 투자할지 여부를 결정하기 위해 투표를 실시할 예정입니다. 전 세계 비디오 게임 시장은 2030년까지 6,000억 달러를 초과할 것으로 전망되며, AI의 활용은 스토리 디자인과 캐릭터 행동에 점점 더 확대되고 있습니다.xAI는 마이크로소프트 Xbox의 Inworld AI와의 파트너십, 엔비디아의 ACE for Games 시스템, 로블록스의 생성형 AI 도구 등 기존 강자들과 경쟁하고 있습니다. 그러나 머스크의 비전은 단순한 게임 제작을 넘어, 스스로 게임을 만들고, 플레이하고, 반복적으로 개선할 수 있는 AI 개발로 확장되고 있습니다.
2824 조회
0 추천
2025.10.07 등록
(퍼플렉시티가 정리한 기사)엘론 머스크는 xAI의 Grok Imagine의 주요 업데이트를 발표하며, 동영상 생성 기능이 강화된 0.9 버전을 공개했습니다. 이번 업데이트로 Grok Imagine은 최근 출시된 OpenAI의 Sora 2와 직접적으로 경쟁할 수 있는 AI 도구로 자리매김하게 되었습니다. 2025년 10월 6일에 발표된 이번 업데이트는 15초 미만의 더욱 빠른 동영상 생성과 사용자의 상호작용을 간소화하는 음성 우선 인터페이스를 도입했습니다.Grok Imagine v0.9은 15초 미만의 동영상 생성 기능을 제공합니다.새 버전은 플랫폼의 초기 0.1 릴리스에서 크게 도약한 것으로, 머스크는 X에서의 발표에서 플랫폼의 속도 우위를 강조했다. “가장 빠른 텍스트 생성 - Grok 4 Fast. 가장 빠른 비디오 생성 - Grok Imagine 비디오 생성 15초 미만,”라고 머스크는 게시하며, 사용자들에게 최신 앱 버전을 다운로드해 새로운 기능에 접근하라고 촉구했다.Grok Imagine의 대규모 업데이트 시점은 OpenAI가 2025년 10월 1일에 Sora 2를 공개한 지 며칠 만으로, AI 비디오 생성 분야에 새로운 경쟁을 촉발했다. Sora 2가 대화와 음향 효과가 동기화된 최대 20초 길이의 영상을 생성할 수 있는 반면, Grok Imagine은 보통 약 6초 정도의 짧은 클립을 빠르게 생성하는 데 초점을 맞추며, 오디오도 동기화된다.음성 우선 인터페이스가 사용자 경험을 개선v0.9 업데이트의 핵심 기능은 사용자가 앱에 진입하자마자 음성 명령을 통해 바로 콘텐츠를 제작할 수 있는 **보이스 퍼스트 인터페이스** 도입입니다. 설정에서 “음성 모드로 앱 열기”를 활성화하면 기존의 텍스트 입력 과정을 건너뛰고 곧바로 말하기를 시작해 영상을 생성할 수 있습니다. 이 기능은 대화형 상호작용을 제공하는 Grok의 기존 음성 비서 Eve를 기반으로 만들어졌습니다. 업데이트에서는 Grok Imagine의 고유한 콘텐츠 모드인 Normal, Fun, 그리고 논란이 많은 “Spicy” 모드를 그대로 유지합니다. “Spicy” 모드는 보다 제한이 적은 콘텐츠 제작을 가능하게 합니다. 초기 사용자 경험에 따르면 플랫폼은 속도 면에서 우수해 이미지와 영상을 경쟁사보다 훨씬 빠르게 생성하지만, 구글의 Veo 3 같은 기존 강자에 비해 품질은 다소 뒤처진다는 평가도 있습니다. 향상된 기능은 Grok Imagine을 머스크의 광범위한 xAI 전략의 일부로 자리매김시킵니다. xAI는 2023년 11월 Grok을 출시하며 기존 대형 언어 모델의 대안을 제시했습니다. 이번 영상 생성 기능은 월 30달러의 SuperGrok 구독자에게 제공되며, 이번 업데이트는 치열한 AI 영상 제작 시장에서 xAI의 야심찬 진출을 의미합니다.
2839 조회
0 추천
2025.10.07 등록
(퍼플랙시티가 정리한 기사)Adobe는 자사의 AI 기반 Firefly Video Generator를 널리 공개하여, 사용자가 정적인 이미지를 인공지능 프롬프트를 통해 애니메이션 동영상으로 변환할 수 있도록 했습니다. 이 클라우드 기반 도구는 Adobe의 생성형 AI 기능을 동영상 제작 분야로 대폭 확장하는 것으로, 빠르고 전문적인 비디오 콘텐츠를 원하는 크리에이터, 마케터, 그리고 비즈니스 고객을 주요 대상으로 삼고 있습니다.Firefly Video Generator는 Adobe Creative Cloud 플랫폼 내에서 직접 통합되어, 사용자가 정지 이미지와 일러스트레이션을 간단한 텍스트 설명만으로도 사실적으로 보이는 애니메이션 클립으로 변환할 수 있게 해줍니다. 사용자는 JPEG 또는 PNG 이미지를 업로드하고, 자연어 프롬프트를 통해 애니메이션 스타일, 카메라 움직임, 시각 효과 등을 지정할 수 있으며, AI가 몇 분 만에 5초 분량의 동영상 클립을 생성합니다.향상된 창의적 제어와 플랫폼 통합이 도구는 기본 애니메이션을 넘어서는 폭넓은 창의적 가능성을 제공합니다. 사용자는 두 개의 정지 이미지를 업로드하여 부드러운 전환 효과를 만들 수 있고, 텍스트-투-비디오 기능을 활용해 완전히 새로운 동영상 콘텐츠를 처음부터 생성할 수 있습니다. 어도비는 TikTok, Instagram, YouTube 등 주요 소셜 미디어 플랫폼에 최적화된 사용자 설정 옵션을 제공하며, 자동으로 화면 비율과 프레임 크기를 조정합니다.크리에이티브 전문가들은 사실적인 시네마틱 장면부터 애니메이션, 클레이메이션, 선화 등 다양한 스타일의 영상을 선택할 수 있습니다. 또한 카메라 앵글 조정, 동작 사양, 조명 설정 같은 고급 기능도 갖추고 있어 사용자가 감독 수준의 동영상 제작을 할 수 있도록 지원합니다.상업적 실현 가능성과 접근성어도비는 Firefly 비디오 생성기를 전문적으로 안전하게 사용할 수 있도록, AI를 오직 어도비 스톡과 기타 허가된 소스의 라이선스 콘텐츠만으로 훈련시켰습니다. 이러한 접근 방식은 지적 재산권 문제를 해결해, 기존의 AI 비디오 생성 도구들에 영향을 주었던 문제를 해소하고 기업들이 생성된 콘텐츠를 라이선스 제한 없이 사용할 수 있도록 합니다.이 서비스는 제한된 무료 사용이 가능한 어도비 크리에이티브 클라우드 구독자들에게 제공되며, 유료 Firefly 플랜은 크레딧 기반 시스템으로 더욱 확장된 접근을 제공합니다. 어도비 Firefly 스탠다드 플랜은 월 $9.99에 2,000개의 비디오 크레딧을 제공하고, 프로 티어는 월 $29.99에 7,000 크레딧을 제공합니다. 사용자는 자신이 원본 이미지에 대한 권리를 소유하고 있다면, 생성된 비디오를 개인 또는 상업적 프로젝트에 자유롭게 사용할 수 있습니다.최신 업데이트에 따르면, 어도비는 Firefly 비디오 모델을 강화하여 사진같은 사실감과 텍스트 렌더링 기능을 개선했으며, 새로운 해상도와 화면 비율도 지원합니다. 회사는 창작 도구 모음 전체에 통합을 확대하고 있으며, 현재는 Firefly 웹 애플리케이션을 통해 비디오 생성 기능을 사용할 수 있고, 앞으로는 프리미어 프로를 비롯한 다른 어도비 애플리케이션에도 통합될 예정입니다.
2884 조회
0 추천
2025.10.07 등록
(퍼플렉시티가 정리한 기사)구글은 혁신적인 얼굴 감지 기술에 대한 특허를 출원했습니다. 이 기술은 사용자가 “헤이 구글”과 같은 핫워드 없이도 휴대폰을 얼굴 근처에 가져왔을 때 근접 센서를 활용해 Gemini AI 어시스턴트를 활성화할 수 있도록 함으로써 근본적으로 사용자 경험을 바꿀 수 있습니다.혁신적인 근접 기반 활성화 기술특허받은 이 시스템은 최신 스마트폰 터치스크린에 탑재된 정전식 센서 그리드를 이용해, 디바이스가 사용자의 얼굴, 특히 입 근처에 가까워졌을 때를 감지합니다. Android Headlines 및 기타 기술 매체의 보도에 따르면, 이 “얼굴-근접” 신호는 Gemini를 자동으로 짧은 시간 동안 활성화시키며, 사용자가 별도의 조작 없이 즉시 명령을 말할 수 있게 해줍니다.이 기술은 사람의 얼굴과 같이 전도성 물체가 터치스크린 센서 근처에 가까워질 때 발생하는 전기장 변화를 분석하는 방식으로 작동합니다. 시스템은 이러한 근접 패턴의 모양과 강도를 처리해, 사용자가 의도적으로 어시스턴트를 호출하려는 시도와 우발적인 활성화 상황을 구분합니다. 시간이 지남에 따라, 머신러닝 알고리즘이 각 사용자의 습관에 적응하면서, 의도적인 활성화 동작을 더욱 정확하게 인식하게 됩니다.배터리 효율적인 설계가 현재의 제한사항을 해결합니다구글은 기존 음성 활성화 방식의 주요 한계를 해결하기 위해 이 시스템을 설계했습니다. 기존의 “Hey Google” 명령어는 시끄러운 환경, 사용자가 마스크를 착용한 경우, 또는 조용히 사용할 필요가 있을 때 종종 제대로 작동하지 않습니다. 새로운 근접 기반 접근 방식은 추가 하드웨어가 필요하지 않고 기존 정전용량 센서를 활용함으로써 저전력 소비를 유지합니다.업계 분석가들은 이 기술이 구글의 픽셀 스마트폰에서 처음 도입된 후, 점차 더 넓은 안드로이드 생태계로 확장될 가능성이 있다고 지적합니다. 특허 출원은 구글이 Gemini를 “상시” 어시스턴트로 만들기 위한 전략의 일환으로, 보다 자연스럽고 직관적인 AI 상호작용으로의 방향 전환을 시사합니다.프라이버시 고려사항 및 시장 영향이 기술은 신원 확인을 위해 얼굴 인식보다는 근접 감지에 중점을 두고 있지만, 여전히 생체 데이터 수집과 관련된 개인정보 보호 문제를 야기합니다. 해당 시스템은 명확한 동의 메커니즘과 강력한 데이터 보안 조치를 요구하는 GDPR 및 EU AI 법률과 같은 규정을 준수해야 합니다.이러한 혁신은 Apple 과 Amazon 과 같은 경쟁사들로 하여금 Siri와 Alexa에 각각 유사한 활성화 방식을 개발하게끔 압박을 가할 수 있습니다. 스마트폰 제조사들에게 이 기술은 Google이 이를 널리 라이선스하거나 Pixel 기기에 독점적으로 적용할 경우 상당한 경쟁 우위를 제공할 수 있습니다.2025년 10월 현재, Google은 이 기술 구현에 대한 구체적인 일정을 발표하지 않았으며, 특허는 즉각적인 제품 출시에 앞서 미래 전략적 방향성을 나타냅니다.
2882 조회
0 추천
2025.10.06 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입