AI 뉴스

엔비디아, 로보틱스를 위한 오픈소스 뉴턴 물리 엔진 출시

페이지 정보

작성자 xtalfi
작성일 2025.09.30 04:35
169 조회
0 추천
0 비추천

본문

c48fbe67f431fe73900a93d8f50a5e898g01.png

(퍼플렉시티가 정리한 기사)

NVIDIA는 오늘 로보틱스 개발에서 중요한 ’시뮬레이션-현실 간 격차(sim-to-real gap)’를 해소하기 위해 설계된 오픈 소스 물리 엔진인 Newton의 베타 출시를 발표했습니다. 이번 발표는 대한민국 서울에서 열린 로봇 학습 컨퍼런스(CoRL)에서 이루어졌으며, NVIDIA, Google DeepMind, Disney Research 간의 주요 협력을 통해 로봇 학습 및 배포 역량을 가속화하는 중요한 이정표를 의미합니다.

 

로봇 훈련을 위한 혁신적인 성능


현재 NVIDIA Isaac Lab에 통합되어 Linux 재단에서 관리하는 Newton은 로보틱스 시뮬레이션에서 전례 없는 성능 향상을 제공합니다. NVIDIA에 따르면, Newton 내의 MuJoCo Warp 솔버는 GeForce RTX 4090 하드웨어에서 기존 솔루션 대비 보행 작업에서 최대 152배, 조작 작업에서 313배 빠른 성능을 달성했다고 합니다. 최신 NVIDIA RTX PRO 6000 Blackwell 시리즈는 MuJoCo Warp에 추가로 44%의 속도 향상, 그리고 경쟁 프레임워크에 75%의 성능 향상을 더합니다.


“NVIDIA의 Omniverse 및 시뮬레이션 기술 부문 부사장인 레브 레바레디언(Rev Lebaredian)은 ‘휴머노이드는 물리적 AI의 다음 프론티어로, 예측 불가능한 세계에서 사고하고, 적응하며, 안전하게 행동할 능력을 필요로 합니다’라고 말했습니다. ‘이 최신 업데이트들을 통해 개발자들은 이제 연구에서 일상으로 로봇을 가져오는 세 가지 컴퓨터를 얻게 되었습니다. Isaac GR00T가 로봇의 두뇌 역할을, Newton이 신체를 시뮬레이션하며 NVIDIA Omniverse가 훈련장이 됩니다.’”


NVIDIA Warp와 OpenUSD 프레임워크를 기반으로 구축된 Newton은 로봇이 변형 가능한 물체, 천, 모래나 자갈과 같은 입자 물질과 상호 작용할 수 있는 복잡한 다물리 시뮬레이션을 가능하게 합니다. 엔진의 미분 가능한 물리 기능은 그래디언트 기반 최적화를 지원하여, 로봇이 시뮬레이션 데이터를 통해 보다 효과적으로 학습할 수 있도록 합니다.

 

업계 도입은 광범위한 영향을 시사한다


선도적인 로봇 기업들은 이미 개발 워크플로우에 뉴턴(Newton)을 도입하기 시작했습니다. 보스턴 다이내믹스(Boston Dynamics)는 뉴턴의 새로운 정교한 파지(grasping) 워크플로우를 활용하여 아틀라스(Atlas) 로봇의 조작 능력을 향상시켰습니다. 기타 주요 도입 기업으로는 애질리티 로보틱스(Agility Robotics), 피규어 AI(Figure AI), 헥사곤(Hexagon), 스킬드 AI(Skild AI), 솔로몬(Solomon), 테크맨 로봇(Techman Robot) 등이 있습니다.


학계 또한 이 기술을 적극적으로 수용하고 있습니다. 취리히 연방 공과대학교(ETH Zurich) 로봇 시스템 연구실은 뉴턴을 활용해 토공 응용 분야에서 다중물리 시뮬레이션을 수행하고 있으며, 뮌헨 공과대학교(Technical University of Munich)는 실제 로봇에서 검증된 정교한 조작 정책을 실행하는 데 사용하고 있습니다. 베이징대학교(Peking University)는 촉각 센서 솔버 타첼(Taccel)을 뉴턴과 통합하여 시각 기반 촉각 로보틱스의 발전을 도모하고 있습니다.


“뉴턴을 리눅스 재단(Linux Foundation)에 도입하는 것은 협업적 로봇 시뮬레이션을 확장하는 데 있어 중요한 진전입니다. 이는 개발을 가속화하고 비용을 줄이며 심-투-리얼(sim-to-real) 로봇의 미래에 한 걸음 더 다가가게 합니다.“라고 리눅스 재단의 전무 이사 짐 젬린(Jim Zemlin)은 말했습니다.

이 오픈소스 엔진은 로보틱스 분야의 근본적인 과제를 해결합니다. 즉, 가상 환경에서 학습된 기술이 실제 로봇에 성공적으로 이식될 수 있도록 하는 것입니다. 보다 정확한 물리 모델링과 GPU 가속 성능을 제공함으로써, 뉴턴은 개발자들이 실제 환경에서 재현하기엔 지나치게 비용이 많이 들거나, 드물거나, 위험한 시나리오에서 로봇을 훈련할 수 있게 해줍니다. 이는 궁극적으로 엔비디아(NVIDIA)가 일조 달러 규모의 ‘피지컬 AI(physical AI)’ 시장으로 진출하려는 전략을 지원합니다.

댓글 0
전체 416 / 31 페이지
(퍼플렉시티가 정리한 기사)NVIDIA는 오늘 로보틱스 개발에서 중요한 ’시뮬레이션-현실 간 격차(sim-to-real gap)’를 해소하기 위해 설계된 오픈 소스 물리 엔진인 Newton의 베타 출시를 발표했습니다. 이번 발표는 대한민국 서울에서 열린 로봇 학습 컨퍼런스(CoRL)에서 이루어졌으며, NVIDIA, Google DeepMind, Disney Research 간의 주요 협력을 통해 로봇 학습 및 배포 역량을 가속화하는 중요한 이정표를 의미합니다.로봇 훈련을 위한 혁신적인 성능현재 NVIDIA Isaac Lab에 통합되어 Linux 재단에서 관리하는 Newton은 로보틱스 시뮬레이션에서 전례 없는 성능 향상을 제공합니다. NVIDIA에 따르면, Newton 내의 MuJoCo Warp 솔버는 GeForce RTX 4090 하드웨어에서 기존 솔루션 대비 보행 작업에서 최대 152배, 조작 작업에서 313배 빠른 성능을 달성했다고 합니다. 최신 NVIDIA RTX PRO 6000 Blackwell 시리즈는 MuJoCo Warp에 추가로 44%의 속도 향상, 그리고 경쟁 프레임워크에 75%의 성능 향상을 더합니다.“NVIDIA의 Omniverse 및 시뮬레이션 기술 부문 부사장인 레브 레바레디언(Rev Lebaredian)은 ‘휴머노이드는 물리적 AI의 다음 프론티어로, 예측 불가능한 세계에서 사고하고, 적응하며, 안전하게 행동할 능력을 필요로 합니다’라고 말했습니다. ‘이 최신 업데이트들을 통해 개발자들은 이제 연구에서 일상으로 로봇을 가져오는 세 가지 컴퓨터를 얻게 되었습니다. Isaac GR00T가 로봇의 두뇌 역할을, Newton이 신체를 시뮬레이션하며 NVIDIA Omniverse가 훈련장이 됩니다.’”NVIDIA Warp와 OpenUSD 프레임워크를 기반으로 구축된 Newton은 로봇이 변형 가능한 물체, 천, 모래나 자갈과 같은 입자 물질과 상호 작용할 수 있는 복잡한 다물리 시뮬레이션을 가능하게 합니다. 엔진의 미분 가능한 물리 기능은 그래디언트 기반 최적화를 지원하여, 로봇이 시뮬레이션 데이터를 통해 보다 효과적으로 학습할 수 있도록 합니다.업계 도입은 광범위한 영향을 시사한다선도적인 로봇 기업들은 이미 개발 워크플로우에 뉴턴(Newton)을 도입하기 시작했습니다. 보스턴 다이내믹스(Boston Dynamics)는 뉴턴의 새로운 정교한 파지(grasping) 워크플로우를 활용하여 아틀라스(Atlas) 로봇의 조작 능력을 향상시켰습니다. 기타 주요 도입 기업으로는 애질리티 로보틱스(Agility Robotics), 피규어 AI(Figure AI), 헥사곤(Hexagon), 스킬드 AI(Skild AI), 솔로몬(Solomon), 테크맨 로봇(Techman Robot) 등이 있습니다.학계 또한 이 기술을 적극적으로 수용하고 있습니다. 취리히 연방 공과대학교(ETH Zurich) 로봇 시스템 연구실은 뉴턴을 활용해 토공 응용 분야에서 다중물리 시뮬레이션을 수행하고 있으며, 뮌헨 공과대학교(Technical University of Munich)는 실제 로봇에서 검증된 정교한 조작 정책을 실행하는 데 사용하고 있습니다. 베이징대학교(Peking University)는 촉각 센서 솔버 타첼(Taccel)을 뉴턴과 통합하여 시각 기반 촉각 로보틱스의 발전을 도모하고 있습니다.“뉴턴을 리눅스 재단(Linux Foundation)에 도입하는 것은 협업적 로봇 시뮬레이션을 확장하는 데 있어 중요한 진전입니다. 이는 개발을 가속화하고 비용을 줄이며 심-투-리얼(sim-to-real) 로봇의 미래에 한 걸음 더 다가가게 합니다.“라고 리눅스 재단의 전무 이사 짐 젬린(Jim Zemlin)은 말했습니다.이 오픈소스 엔진은 로보틱스 분야의 근본적인 과제를 해결합니다. 즉, 가상 환경에서 학습된 기술이 실제 로봇에 성공적으로 이식될 수 있도록 하는 것입니다. 보다 정확한 물리 모델링과 GPU 가속 성능을 제공함으로써, 뉴턴은 개발자들이 실제 환경에서 재현하기엔 지나치게 비용이 많이 들거나, 드물거나, 위험한 시나리오에서 로봇을 훈련할 수 있게 해줍니다. 이는 궁극적으로 엔비디아(NVIDIA)가 일조 달러 규모의 ‘피지컬 AI(physical AI)’ 시장으로 진출하려는 전략을 지원합니다.
170 조회
0 추천
2025.09.30 등록
(퍼플렉시티가 정리한 기사)앤트로픽은 월요일에 Claude Sonnet 4.5를 공개하며, 이 인공지능 모델이 자율 코딩 능력에서 획기적인 발전을 이뤘음을 강조했습니다. Claude Sonnet 4.5는 30시간 이상 연속으로 작업할 수 있는데, 이는 이전 모델보다 네 배 이상 오래 지속되는 것입니다.샌프란시스코에 본사를 둔 이 AI 기업은 의 지원을 받고 있으며, 기업 가치는 1,830억 달러에 달합니다. 앤트로픽은 이번 신형 모델이 산업 벤치마크 전반의 성능을 바탕으로 “세계 최고의 코딩 모델”이라고 주장합니다. Claude Sonnet 4.5는 실제 프로그래밍 과제로 AI 모델을 평가하는 엄격한 소프트웨어 엔지니어링 시험인 SWE-Bench Verified에서 77.2%의 점수를 획득했습니다.혁신적인 자율 역량모델의 확장된 운영 능력은 5월 출시 당시 약 7시간 동안만 집중을 유지할 수 있었던 Claude Opus 4에서 획기적인 도약을 보여줍니다. 내부 테스트 동안 Claude Sonnet 4.5는 전체 채팅 애플리케이션을 자율적으로 개발했으며, 개발 과정 전반에 걸쳐 일관성을 유지하면서 약 11,000줄의 코드를 생성했습니다.“Claude Sonnet 4.5는 우리의 기대를 새롭게 합니다—30시간 이상의 자율 코딩을 소화하며, 엔지니어들이 복잡한 아키텍처 작업을 몇 달씩 들여야 할 일을 대폭 단축된 시간 내에, 방대한 코드베이스 전반에서 일관성을 유지하면서 처리할 수 있도록 돕습니다,“라고 iGent AI의 CEO인 Sean Ward는 밝혔습니다.이 모델은 또한 컴퓨터 상호작용 작업에서도 우수한 성능을 보여줬으며, OSWorld 벤치마크에서 61.4%의 점수를 획득해, 불과 4개월 전 Claude Sonnet 4가 기록한 42.2%에서 거의 20%포인트 향상된 결과를 보였습니다.향상된 개발자 도구 및 안전 기능순수한 코딩 성능을 넘어서, Claude Sonnet 4.5는 도구의 향상과 안전성 강화로 개발자 워크플로우에 중요한 개선을 도입했습니다. 이 모델은 이제 Claude Code에서 체크포인트를 지원하여, 개발자가 진행 상황을 저장하고 이전 상태로 되돌릴 수 있게 하였습니다. 이는 코딩 커뮤니티에서 가장 많이 요청된 기능 중 하나를 해결한 것입니다. 또한, 사용자들은 이제 대화 내에서 직접 코드 실행은 물론, 스프레드시트, 슬라이드, 문서 등 다양한 파일을 생성할 수 있습니다.Anthropic은 이를 “지금까지 가장 정렬된 프런티어 모델”로 자리매김하며, 아첨, 기만, 권력 추구와 같은 문제적인 행동이 대폭 감소한 점을 강조하고 있습니다. 또한, 악의적인 행위자가 특별히 제작한 입력값을 통해 AI 시스템을 조작하려고 하는 프롬프트 인젝션 공격에 대한 방어도 한층 강화했습니다. 이러한 안전성 개선과 더불어 Claude Agent SDK가 출시되어, 개발자들이 Claude Code를 구동하는 것과 동일한 인프라를 활용하여, 메모리 관리, 권한 처리, 다중 서브에이전트 조정이 가능한 독자적인 자율 에이전트를 구축할 수 있게 됐습니다.
211 조회
0 추천
2025.09.30 등록
(퍼플렉시티가 정리한 기사)중국 AI 개발사 딥시크(DeepSeek)는 2025년 9월 29일, 혁신적인 희소 주의(sparse attention) 기술을 도입한 실험적 V3.2-Exp 모델을 출시했습니다. 이 기술은 최상급 AI 시스템에 견줄만한 성능을 유지하면서도 컴퓨팅 비용을 획기적으로 줄였습니다. 이번 출시로 항저우에 기반을 둔 딥시크는 오픈AI(OpenAI)와 같은 글로벌 기업은 물론, 알리바바 그룹 홀딩 리미티드의 Qwen 플랫폼을 포함한 국내 경쟁사들과의 AI 경쟁에서 강력한 경쟁자로 부상했습니다.V3.2-Exp 모델은 딥시크 희소 주의(DeepSeek Sparse Attention, DSA)을 처음으로 선보였으며, 이는 “처음으로 미세하게 조정된 희소 주의(fine-grained sparse attention)를 달성했다”고 개발자 플랫폼 허깅페이스(Hugging Face)에 발표했습니다. 이 기술로 인해 모델은 기존 방식보다 최대 64배 빠르게 긴 텍스트 시퀀스를 처리할 수 있으며, 메모리 사용량도 30~40% 절감되고 훈련 효율성은 약 50% 향상되었습니다.시장 교란을 일으키는 가격 인하, 경쟁 압박 신호DeepSeek는 API 가격을 50% 이상 인하했다고 발표했으며, 캐시 히트 시 입력 비용은 백만 토큰당 $0.07까지, 캐시 미스 시에는 백만 토큰당 $0.56까지 낮아졌습니다. 이러한 극적인 가격 인하는 2025년 1월 R1 모델 출시 당시 엔비디아 등 기존 AI 선두 기업에 위협이 될 것을 우려한 투자자들로 인해 6,000억 달러 규모의 주식 시장 매도 사태가 발생했던 회사의 과거 시장 교란을 떠올리게 합니다.이 회사는 V3.2-Exp를 “차세대 아키텍처로 가는 중간 단계”라고 설명했으며, 이는 V3.1-Terminus 기반 위에 구축되었습니다. 추론, 코딩, 수학적 문제 해결 등 다양한 분야의 벤치마크 테스트에서 새로운 모델은 전작과 동등한 성능을 보이면서도 상당한 효율성 향상을 제공했습니다. 프로그래밍 챌린지에서 V3.2-Exp는 Codeforces 벤치마크 기준 V3.1-Terminus가 기록한 2,046점 대비 2,121점을 획득했습니다.스파스 어텐션 기술이 핵심 AI 효율성 문제를 해결합니다혁신적인 희소 주의력 메커니즘(sparse attention mechanism)은 대형 언어 모델에서 가장 중요한 계산상의 과제 중 하나를 해결합니다. 이 메커니즘은 긴 텍스트 시퀀스에서 관련된 부분만 선택적으로 처리함으로써 효율성을 높입니다. 기존의 주의력 메커니즘(attention mechanism)은 모든 토큰 간의 관계를 계산해야 하며, 이는 시퀀스가 길어질수록 계산 복잡도가 제곱으로 증가하여 매우 비싸집니다.DeepSeek가 구현한 방식은 ‘라이트닝 인덱서(lightning indexer)’라고 불리는 도구를 사용하여 토큰의 중요도를 점수화하고 순위를 매깁니다. 각 쿼리에 가장 관련성이 높은 연결만 유지하는 방식으로, 불필요한 계산을 줄입니다. 이 선택적 접근법을 통해 최대 128,000 토큰의 긴 시퀀스도 처리할 수 있으며, 출력 품질은 완전한 주의력 메커니즘과 거의 동일하게 유지됩니다.이 모델은 즉시 DeepSeek의 앱, 웹 플랫폼 및 API 서비스를 통해 이용 가능하며, 오픈소스는 Hugging Face 및 GitHub 저장소를 통해 제공됩니다. 또한, 회사는 다양한 하드웨어 환경에서 연구와 배포를 용이하게 하기 위해 TileLang과 CUDA 형식의 GPU 커널도 공개했습니다.이번 발표는 글로벌 AI 경쟁이 격화되는 가운데 이루어졌습니다. 특히 중국 기업들이 인공지능 개발 분야에서 미국의 우위를 정면으로 도전하고 있습니다. 최근 분석에 따르면, 중국 기업들은 독자적인 AI 개발 경로를 구축하여 비용 효율성과 빠른 배치를 극대화함으로써 서방 경쟁사들을 이미 따라잡거나 앞서가고 있는 것으로 나타났습니다.
162 조회
0 추천
2025.09.30 등록
(퍼플렉시티가 정리한 기사)마이크로소프트가 Microsoft 365 제품군에 AI 에이전트 모드와 오피스 에이전트를 출시하여 복잡한 작업을 Word, Excel, PowerPoint에서 자동화하는 “바이브 워킹(vibe working)“을 도입했습니다. 9월 28일에 발표된 이번 소식은 생산성 애플리케이션에서 AI 기반 워크플로 자동화로의 중요한 전환을 의미합니다.에이전트 모드가 오피스 업무 프로세스를 혁신합니다에이전트 모드(Agent Mode)는 Excel과 Word에 직접 통합되어 사용자가 간단한 프롬프트를 통해 정교한 문서와 스프레드시트를 생성할 수 있도록 합니다. 이 기능은 OpenAI의 최신 추론 모델을 활용하여 복잡한 작업을 관리 가능한 단계로 나누는데, 이는 “바이브 코딩(vibe coding)“이 소프트웨어 개발을 혁신한 방식과 유사합니다.“바이브 코딩이 소프트웨어 개발을 변화시킨 것과 같은 방식으로, Copilot의 최신 추론 모델은 Office 산출물에 에이전트 생산성을 제공합니다,”라고 Microsoft Office Product Group의 기업 부사장 Sumit Chauhan이 말했습니다. “이것이 인간과 에이전트가 협업하는 새로운 업무 패턴입니다.”Excel에서는 Agent Mode가 데이터를 분석하고, 시각화하며, 재무 모델을 구축하고, 종합적인 보고서를 생성할 수 있습니다. Microsoft는 이 기능이 SpreadsheetBench라는 AI 스프레드시트 능력의 벤치마크에서 57.2%의 정확도를 달성했으며, 인간 사용자의 경우 71.3%라고 보고합니다. 시스템은 데이터를 스스로 평가하고, 문제를 수정하며, 검증된 결과가 나올 때까지 반복할 수 있습니다.Word 사용자를 위해 Agent Mode는 문서 작성 과정을 AI가 초안을 작성하고, 개선점을 제안하며, 전문적인 서식을 적용하는 인터랙티브 경험으로 변화시킵니다. 사용자는 “이 월간 보고서를 최신 데이터로 업데이트해줘”와 같은 요청을 시스템에 입력하면 AI가 복잡한 작업을 알아서 처리하는 모습을 볼 수 있습니다.오피스 에이전트, 앤스로픽 모델을 마이크로소프트 365에 도입Agent Mode와 더불어, 마이크로소프트는 Copilot 채팅에서 OpenAI의 기술이 아닌 Anthropic의 AI 모델을 기반으로 하는 Office Agent를 도입했습니다. 이 채팅 중심의 경험을 통해 PowerPoint 프레젠테이션과 Word 문서를 생성할 수 있으며, 웹 리서치를 수행하고 사용자의 요구 사항에 대한 명확한 질문을 할 수 있습니다.이러한 이중 접근 방식은 다양한 작업에 대한 성능 최적화를 위해 여러 AI 공급업체를 활용하겠다는 마이크로소프트의 전략을 보여줍니다. Office Agent는 대화형 워크플로우를 통해 프레젠테이션 생성과 문서 작성을 처리하며, Agent Mode는 앱 내 생산성 향상에 중점을 둡니다.프론티어 프로그램을 통한 제한적 출시두 기능 모두 현재 Microsoft 365 Copilot 라이선스 고객과 Microsoft 365 Personal 또는 Family 구독자를 위한 Microsoft의 Frontier 프로그램을 통해 제공되고 있습니다. Agent Mode는 Word와 Excel의 웹 기반 버전에서 작동하며, 데스크톱 애플리케이션은 곧 출시될 예정입니다. Office Agent는 현재 미국 거주 Personal 또는 Family 구독자가 웹 인터페이스를 통해 사용할 수 있습니다.이번 출시는 전문화된 에이전트들이 개별 비서처럼 따로 작동하는 것이 아니라, 복잡한 비즈니스 프로세스를 함께 처리하는 “에이전트형 AI(agentic AI)”를 기업 소프트웨어에 도입하려는 Microsoft의 광범위한 추진의 일환입니다. 또한, Microsoft는 Copilot Studio에 여러 에이전트가 엔드 투 엔드 워크플로우에 협업할 수 있도록 멀티 에이전트 오케스트레이션 기능도 도입했습니다.
185 조회
0 추천
2025.09.30 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입