AI 뉴스

알트먼, 물리학자 도이치와 함께 '튜링 테스트 2.0' 제안

페이지 정보

작성자 xtalfi
작성일 2025.09.27 04:20
213 조회
0 추천
0 비추천

본문

d5698c4679cb84c7bb218e3595477146kJUV.png

(퍼플렉시티가 정리한 기사)

OpenAI CEO 샘 올트먼은 이번 주 초지능형 AI가 2030년까지 도래할 것이라는 대담한 예측을 다시 강조하면서, 저명한 물리학자 데이비드 도이치와 함께 인공지능 일반(AI) 테스트에 대한 획기적인 새로운 방안을 제안했습니다. 올트먼은 수요일 베를린의 악셀 슈프링어 어워드 시상식에서 연설하며, 컴퓨팅 파워가 전례 없는 규모에 도달한다면 AI 시스템이 10년 내에 암을 치료할 수 있을 것이라는 비전을 제시했습니다.

 

인공지능 지능의 혁신적 기준


알트만을 기쁘게 한 깜짝 등장으로, 양자 컴퓨팅의 개척자 데이비드 도이치가 영상 링크를 통해 베를린 행사에 합류하여 그들이 “튜링 테스트 2.0”이라 이름 붙인 제안을 내놓았다. 새로운 기준은 물리학에서 가장 난해한 문제 중 하나인 양자 중력에 초점을 맞춘다.


“만약 미래의 모델이 양자 중력을 알아내고 그 이야기를 — 어떤 문제를 선택했는지, 왜 그것을 추구했는지 — 알려줄 수 있다면, 그게 당신을 설득하기에 충분하겠습니까?“라고 알트만이 도이치에게 질문했다. 양자 컴퓨팅의 아버지로 알려진 이 물리학자는 그러한 능력이 진정한 인공지능임을 보여준다고 동의했다.


도이치는 진정한 지능이란 기존 정보를 단순히 재조합하는 것이 아니라 새로운 지식을 창조하는 것이라고 강조했다. “거대 언어 모델은 방대한 지식에 기반해 끝없이 말할 수 있습니다,“라고 그는 설명했다. “제 생각에 진정한 지능이란 지식을 창조하는 능력 — 문제를 발견하고, 해결책을 고안하며, 그것을 시험하고 인간처럼 개선하는 것이라고 봅니다”.

 

초지능 타임라인과 암 치료의 돌파구


Altman은 2030년 전망을 재확인하며 기자들에게 “이번 10년이 끝날 때쯤, 우리가 직접 할 수 없는 일들을 할 수 있는 매우 뛰어난 모델이 등장하지 않는다면 저는 정말 놀랄 것입니다”라고 말했다. 그는 앞으로 몇 년 안에 AI가 인간이 독자적으로 해낼 수 없는 과학적 발견을 이루게 될 것이라고 내다봤다.


오픈AI 최고경영자는 특히 암을 AI 돌파구의 타깃으로 삼으며, 이는 대규모 컴퓨팅 인프라가 뒷받침되어야 한다고 강조했다. “아마도 10기가와트의 컴퓨팅 파워가 있다면, AI가 암 치료 방법을 밝혀낼 수 있을지 모르겠다”고 Altman은 최근 블로그 게시물에서 밝혔다. 그는 이러한 컴퓨팅 역량이 개인 맞춤형 치료를 가능하게 하고, 의료 연구의 근본적인 변화를 이끌 수 있을 것이라고 제안했다.

 

역사적인 인프라 투자


알트만의 야심찬 일정은 오픈AI가 역사상 최대 규모의 AI 인프라 프로젝트를 발표한 것과 맞물린다. 이 회사는 9월 22일 Nvidia와의 1,000억 달러 규모 전략적 파트너십을 공개하며, 최소 10기가와트에 달하는 컴퓨팅 시스템을 구축할 계획임을 밝혔다. 이는 10개의 원자력 발전소와 맞먹는 전력 소비량이다.


“Nvidia 창립자 젠슨 황은 “이것은 역사상 가장 큰 AI 인프라 프로젝트입니다.”라고 선언했다. “우리는 실제로 모든 응용프로그램, 모든 사용 사례, 모든 기기에 인텔리전스를 연결할 것입니다”. 첫 번째 1기가와트 규모 시스템은 2026년 말, Nvidia의 Vera Rubin 플랫폼을 통해 가동될 예정이다.


컴퓨팅 요구 사항은 압도적이다. 계획된 10기가와트는 약 400만~500만 개의 그래픽 처리 장치를 구동할 수 있는데, 이는 Nvidia의 연간 GPU 출하량 전체와 맞먹는 규모다. 알트만은 이 인프라를 인공지능을 “근본적인 인권”으로 실현하기 위해 필수적이라고 강조했다.

댓글 0
전체 416 / 31 페이지
(퍼플렉시티가 정리한 기사)NVIDIA는 오늘 로보틱스 개발에서 중요한 ’시뮬레이션-현실 간 격차(sim-to-real gap)’를 해소하기 위해 설계된 오픈 소스 물리 엔진인 Newton의 베타 출시를 발표했습니다. 이번 발표는 대한민국 서울에서 열린 로봇 학습 컨퍼런스(CoRL)에서 이루어졌으며, NVIDIA, Google DeepMind, Disney Research 간의 주요 협력을 통해 로봇 학습 및 배포 역량을 가속화하는 중요한 이정표를 의미합니다.로봇 훈련을 위한 혁신적인 성능현재 NVIDIA Isaac Lab에 통합되어 Linux 재단에서 관리하는 Newton은 로보틱스 시뮬레이션에서 전례 없는 성능 향상을 제공합니다. NVIDIA에 따르면, Newton 내의 MuJoCo Warp 솔버는 GeForce RTX 4090 하드웨어에서 기존 솔루션 대비 보행 작업에서 최대 152배, 조작 작업에서 313배 빠른 성능을 달성했다고 합니다. 최신 NVIDIA RTX PRO 6000 Blackwell 시리즈는 MuJoCo Warp에 추가로 44%의 속도 향상, 그리고 경쟁 프레임워크에 75%의 성능 향상을 더합니다.“NVIDIA의 Omniverse 및 시뮬레이션 기술 부문 부사장인 레브 레바레디언(Rev Lebaredian)은 ‘휴머노이드는 물리적 AI의 다음 프론티어로, 예측 불가능한 세계에서 사고하고, 적응하며, 안전하게 행동할 능력을 필요로 합니다’라고 말했습니다. ‘이 최신 업데이트들을 통해 개발자들은 이제 연구에서 일상으로 로봇을 가져오는 세 가지 컴퓨터를 얻게 되었습니다. Isaac GR00T가 로봇의 두뇌 역할을, Newton이 신체를 시뮬레이션하며 NVIDIA Omniverse가 훈련장이 됩니다.’”NVIDIA Warp와 OpenUSD 프레임워크를 기반으로 구축된 Newton은 로봇이 변형 가능한 물체, 천, 모래나 자갈과 같은 입자 물질과 상호 작용할 수 있는 복잡한 다물리 시뮬레이션을 가능하게 합니다. 엔진의 미분 가능한 물리 기능은 그래디언트 기반 최적화를 지원하여, 로봇이 시뮬레이션 데이터를 통해 보다 효과적으로 학습할 수 있도록 합니다.업계 도입은 광범위한 영향을 시사한다선도적인 로봇 기업들은 이미 개발 워크플로우에 뉴턴(Newton)을 도입하기 시작했습니다. 보스턴 다이내믹스(Boston Dynamics)는 뉴턴의 새로운 정교한 파지(grasping) 워크플로우를 활용하여 아틀라스(Atlas) 로봇의 조작 능력을 향상시켰습니다. 기타 주요 도입 기업으로는 애질리티 로보틱스(Agility Robotics), 피규어 AI(Figure AI), 헥사곤(Hexagon), 스킬드 AI(Skild AI), 솔로몬(Solomon), 테크맨 로봇(Techman Robot) 등이 있습니다.학계 또한 이 기술을 적극적으로 수용하고 있습니다. 취리히 연방 공과대학교(ETH Zurich) 로봇 시스템 연구실은 뉴턴을 활용해 토공 응용 분야에서 다중물리 시뮬레이션을 수행하고 있으며, 뮌헨 공과대학교(Technical University of Munich)는 실제 로봇에서 검증된 정교한 조작 정책을 실행하는 데 사용하고 있습니다. 베이징대학교(Peking University)는 촉각 센서 솔버 타첼(Taccel)을 뉴턴과 통합하여 시각 기반 촉각 로보틱스의 발전을 도모하고 있습니다.“뉴턴을 리눅스 재단(Linux Foundation)에 도입하는 것은 협업적 로봇 시뮬레이션을 확장하는 데 있어 중요한 진전입니다. 이는 개발을 가속화하고 비용을 줄이며 심-투-리얼(sim-to-real) 로봇의 미래에 한 걸음 더 다가가게 합니다.“라고 리눅스 재단의 전무 이사 짐 젬린(Jim Zemlin)은 말했습니다.이 오픈소스 엔진은 로보틱스 분야의 근본적인 과제를 해결합니다. 즉, 가상 환경에서 학습된 기술이 실제 로봇에 성공적으로 이식될 수 있도록 하는 것입니다. 보다 정확한 물리 모델링과 GPU 가속 성능을 제공함으로써, 뉴턴은 개발자들이 실제 환경에서 재현하기엔 지나치게 비용이 많이 들거나, 드물거나, 위험한 시나리오에서 로봇을 훈련할 수 있게 해줍니다. 이는 궁극적으로 엔비디아(NVIDIA)가 일조 달러 규모의 ‘피지컬 AI(physical AI)’ 시장으로 진출하려는 전략을 지원합니다.
163 조회
0 추천
2025.09.30 등록
(퍼플렉시티가 정리한 기사)앤트로픽은 월요일에 Claude Sonnet 4.5를 공개하며, 이 인공지능 모델이 자율 코딩 능력에서 획기적인 발전을 이뤘음을 강조했습니다. Claude Sonnet 4.5는 30시간 이상 연속으로 작업할 수 있는데, 이는 이전 모델보다 네 배 이상 오래 지속되는 것입니다.샌프란시스코에 본사를 둔 이 AI 기업은 의 지원을 받고 있으며, 기업 가치는 1,830억 달러에 달합니다. 앤트로픽은 이번 신형 모델이 산업 벤치마크 전반의 성능을 바탕으로 “세계 최고의 코딩 모델”이라고 주장합니다. Claude Sonnet 4.5는 실제 프로그래밍 과제로 AI 모델을 평가하는 엄격한 소프트웨어 엔지니어링 시험인 SWE-Bench Verified에서 77.2%의 점수를 획득했습니다.혁신적인 자율 역량모델의 확장된 운영 능력은 5월 출시 당시 약 7시간 동안만 집중을 유지할 수 있었던 Claude Opus 4에서 획기적인 도약을 보여줍니다. 내부 테스트 동안 Claude Sonnet 4.5는 전체 채팅 애플리케이션을 자율적으로 개발했으며, 개발 과정 전반에 걸쳐 일관성을 유지하면서 약 11,000줄의 코드를 생성했습니다.“Claude Sonnet 4.5는 우리의 기대를 새롭게 합니다—30시간 이상의 자율 코딩을 소화하며, 엔지니어들이 복잡한 아키텍처 작업을 몇 달씩 들여야 할 일을 대폭 단축된 시간 내에, 방대한 코드베이스 전반에서 일관성을 유지하면서 처리할 수 있도록 돕습니다,“라고 iGent AI의 CEO인 Sean Ward는 밝혔습니다.이 모델은 또한 컴퓨터 상호작용 작업에서도 우수한 성능을 보여줬으며, OSWorld 벤치마크에서 61.4%의 점수를 획득해, 불과 4개월 전 Claude Sonnet 4가 기록한 42.2%에서 거의 20%포인트 향상된 결과를 보였습니다.향상된 개발자 도구 및 안전 기능순수한 코딩 성능을 넘어서, Claude Sonnet 4.5는 도구의 향상과 안전성 강화로 개발자 워크플로우에 중요한 개선을 도입했습니다. 이 모델은 이제 Claude Code에서 체크포인트를 지원하여, 개발자가 진행 상황을 저장하고 이전 상태로 되돌릴 수 있게 하였습니다. 이는 코딩 커뮤니티에서 가장 많이 요청된 기능 중 하나를 해결한 것입니다. 또한, 사용자들은 이제 대화 내에서 직접 코드 실행은 물론, 스프레드시트, 슬라이드, 문서 등 다양한 파일을 생성할 수 있습니다.Anthropic은 이를 “지금까지 가장 정렬된 프런티어 모델”로 자리매김하며, 아첨, 기만, 권력 추구와 같은 문제적인 행동이 대폭 감소한 점을 강조하고 있습니다. 또한, 악의적인 행위자가 특별히 제작한 입력값을 통해 AI 시스템을 조작하려고 하는 프롬프트 인젝션 공격에 대한 방어도 한층 강화했습니다. 이러한 안전성 개선과 더불어 Claude Agent SDK가 출시되어, 개발자들이 Claude Code를 구동하는 것과 동일한 인프라를 활용하여, 메모리 관리, 권한 처리, 다중 서브에이전트 조정이 가능한 독자적인 자율 에이전트를 구축할 수 있게 됐습니다.
209 조회
0 추천
2025.09.30 등록
(퍼플렉시티가 정리한 기사)중국 AI 개발사 딥시크(DeepSeek)는 2025년 9월 29일, 혁신적인 희소 주의(sparse attention) 기술을 도입한 실험적 V3.2-Exp 모델을 출시했습니다. 이 기술은 최상급 AI 시스템에 견줄만한 성능을 유지하면서도 컴퓨팅 비용을 획기적으로 줄였습니다. 이번 출시로 항저우에 기반을 둔 딥시크는 오픈AI(OpenAI)와 같은 글로벌 기업은 물론, 알리바바 그룹 홀딩 리미티드의 Qwen 플랫폼을 포함한 국내 경쟁사들과의 AI 경쟁에서 강력한 경쟁자로 부상했습니다.V3.2-Exp 모델은 딥시크 희소 주의(DeepSeek Sparse Attention, DSA)을 처음으로 선보였으며, 이는 “처음으로 미세하게 조정된 희소 주의(fine-grained sparse attention)를 달성했다”고 개발자 플랫폼 허깅페이스(Hugging Face)에 발표했습니다. 이 기술로 인해 모델은 기존 방식보다 최대 64배 빠르게 긴 텍스트 시퀀스를 처리할 수 있으며, 메모리 사용량도 30~40% 절감되고 훈련 효율성은 약 50% 향상되었습니다.시장 교란을 일으키는 가격 인하, 경쟁 압박 신호DeepSeek는 API 가격을 50% 이상 인하했다고 발표했으며, 캐시 히트 시 입력 비용은 백만 토큰당 $0.07까지, 캐시 미스 시에는 백만 토큰당 $0.56까지 낮아졌습니다. 이러한 극적인 가격 인하는 2025년 1월 R1 모델 출시 당시 엔비디아 등 기존 AI 선두 기업에 위협이 될 것을 우려한 투자자들로 인해 6,000억 달러 규모의 주식 시장 매도 사태가 발생했던 회사의 과거 시장 교란을 떠올리게 합니다.이 회사는 V3.2-Exp를 “차세대 아키텍처로 가는 중간 단계”라고 설명했으며, 이는 V3.1-Terminus 기반 위에 구축되었습니다. 추론, 코딩, 수학적 문제 해결 등 다양한 분야의 벤치마크 테스트에서 새로운 모델은 전작과 동등한 성능을 보이면서도 상당한 효율성 향상을 제공했습니다. 프로그래밍 챌린지에서 V3.2-Exp는 Codeforces 벤치마크 기준 V3.1-Terminus가 기록한 2,046점 대비 2,121점을 획득했습니다.스파스 어텐션 기술이 핵심 AI 효율성 문제를 해결합니다혁신적인 희소 주의력 메커니즘(sparse attention mechanism)은 대형 언어 모델에서 가장 중요한 계산상의 과제 중 하나를 해결합니다. 이 메커니즘은 긴 텍스트 시퀀스에서 관련된 부분만 선택적으로 처리함으로써 효율성을 높입니다. 기존의 주의력 메커니즘(attention mechanism)은 모든 토큰 간의 관계를 계산해야 하며, 이는 시퀀스가 길어질수록 계산 복잡도가 제곱으로 증가하여 매우 비싸집니다.DeepSeek가 구현한 방식은 ‘라이트닝 인덱서(lightning indexer)’라고 불리는 도구를 사용하여 토큰의 중요도를 점수화하고 순위를 매깁니다. 각 쿼리에 가장 관련성이 높은 연결만 유지하는 방식으로, 불필요한 계산을 줄입니다. 이 선택적 접근법을 통해 최대 128,000 토큰의 긴 시퀀스도 처리할 수 있으며, 출력 품질은 완전한 주의력 메커니즘과 거의 동일하게 유지됩니다.이 모델은 즉시 DeepSeek의 앱, 웹 플랫폼 및 API 서비스를 통해 이용 가능하며, 오픈소스는 Hugging Face 및 GitHub 저장소를 통해 제공됩니다. 또한, 회사는 다양한 하드웨어 환경에서 연구와 배포를 용이하게 하기 위해 TileLang과 CUDA 형식의 GPU 커널도 공개했습니다.이번 발표는 글로벌 AI 경쟁이 격화되는 가운데 이루어졌습니다. 특히 중국 기업들이 인공지능 개발 분야에서 미국의 우위를 정면으로 도전하고 있습니다. 최근 분석에 따르면, 중국 기업들은 독자적인 AI 개발 경로를 구축하여 비용 효율성과 빠른 배치를 극대화함으로써 서방 경쟁사들을 이미 따라잡거나 앞서가고 있는 것으로 나타났습니다.
153 조회
0 추천
2025.09.30 등록
(퍼플렉시티가 정리한 기사)마이크로소프트가 Microsoft 365 제품군에 AI 에이전트 모드와 오피스 에이전트를 출시하여 복잡한 작업을 Word, Excel, PowerPoint에서 자동화하는 “바이브 워킹(vibe working)“을 도입했습니다. 9월 28일에 발표된 이번 소식은 생산성 애플리케이션에서 AI 기반 워크플로 자동화로의 중요한 전환을 의미합니다.에이전트 모드가 오피스 업무 프로세스를 혁신합니다에이전트 모드(Agent Mode)는 Excel과 Word에 직접 통합되어 사용자가 간단한 프롬프트를 통해 정교한 문서와 스프레드시트를 생성할 수 있도록 합니다. 이 기능은 OpenAI의 최신 추론 모델을 활용하여 복잡한 작업을 관리 가능한 단계로 나누는데, 이는 “바이브 코딩(vibe coding)“이 소프트웨어 개발을 혁신한 방식과 유사합니다.“바이브 코딩이 소프트웨어 개발을 변화시킨 것과 같은 방식으로, Copilot의 최신 추론 모델은 Office 산출물에 에이전트 생산성을 제공합니다,”라고 Microsoft Office Product Group의 기업 부사장 Sumit Chauhan이 말했습니다. “이것이 인간과 에이전트가 협업하는 새로운 업무 패턴입니다.”Excel에서는 Agent Mode가 데이터를 분석하고, 시각화하며, 재무 모델을 구축하고, 종합적인 보고서를 생성할 수 있습니다. Microsoft는 이 기능이 SpreadsheetBench라는 AI 스프레드시트 능력의 벤치마크에서 57.2%의 정확도를 달성했으며, 인간 사용자의 경우 71.3%라고 보고합니다. 시스템은 데이터를 스스로 평가하고, 문제를 수정하며, 검증된 결과가 나올 때까지 반복할 수 있습니다.Word 사용자를 위해 Agent Mode는 문서 작성 과정을 AI가 초안을 작성하고, 개선점을 제안하며, 전문적인 서식을 적용하는 인터랙티브 경험으로 변화시킵니다. 사용자는 “이 월간 보고서를 최신 데이터로 업데이트해줘”와 같은 요청을 시스템에 입력하면 AI가 복잡한 작업을 알아서 처리하는 모습을 볼 수 있습니다.오피스 에이전트, 앤스로픽 모델을 마이크로소프트 365에 도입Agent Mode와 더불어, 마이크로소프트는 Copilot 채팅에서 OpenAI의 기술이 아닌 Anthropic의 AI 모델을 기반으로 하는 Office Agent를 도입했습니다. 이 채팅 중심의 경험을 통해 PowerPoint 프레젠테이션과 Word 문서를 생성할 수 있으며, 웹 리서치를 수행하고 사용자의 요구 사항에 대한 명확한 질문을 할 수 있습니다.이러한 이중 접근 방식은 다양한 작업에 대한 성능 최적화를 위해 여러 AI 공급업체를 활용하겠다는 마이크로소프트의 전략을 보여줍니다. Office Agent는 대화형 워크플로우를 통해 프레젠테이션 생성과 문서 작성을 처리하며, Agent Mode는 앱 내 생산성 향상에 중점을 둡니다.프론티어 프로그램을 통한 제한적 출시두 기능 모두 현재 Microsoft 365 Copilot 라이선스 고객과 Microsoft 365 Personal 또는 Family 구독자를 위한 Microsoft의 Frontier 프로그램을 통해 제공되고 있습니다. Agent Mode는 Word와 Excel의 웹 기반 버전에서 작동하며, 데스크톱 애플리케이션은 곧 출시될 예정입니다. Office Agent는 현재 미국 거주 Personal 또는 Family 구독자가 웹 인터페이스를 통해 사용할 수 있습니다.이번 출시는 전문화된 에이전트들이 개별 비서처럼 따로 작동하는 것이 아니라, 복잡한 비즈니스 프로세스를 함께 처리하는 “에이전트형 AI(agentic AI)”를 기업 소프트웨어에 도입하려는 Microsoft의 광범위한 추진의 일환입니다. 또한, Microsoft는 Copilot Studio에 여러 에이전트가 엔드 투 엔드 워크플로우에 협업할 수 있도록 멀티 에이전트 오케스트레이션 기능도 도입했습니다.
177 조회
0 추천
2025.09.30 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입