Loading...

AI 뉴스

DeepSeek의 수학 모델이 인간의 Putnam 점수를 넘어서다

페이지 정보

작성자 xtalfi
작성일 2025.11.29 17:59
561 조회
0 추천
0 비추천

본문

2245513521_ywnwo3.jpg

중국 AI 스타트업 DeepSeek은 목요일 오픈소스 수학적 추론 모델인 DeepSeekMath-V2를 공개했으며, 이 모델은 2024년 Putnam 수학 경시대회에서 120점 만점에 118점이라는 거의 완벽한 점수를 달성하여 인간 최고 점수인 90점을 능가했다. 6,850억 개의 매개변수를 가진 이 모델은 또한 International Mathematical Olympiad 2025와 Chinese Mathematical Olympiad 2024에서 금메달 수준의 성능을 달성했다.​

DeepSeekMath-V2가 IMO 수준 경시대회에서 금메달 등급을 달성한 최초의 오픈소스 모델이 되면서, 이번 출시는 AI 기반 수학적 추론의 전환점을 나타낸다. 올해 초 유사한 이정표를 달성한 OpenAI와 Google DeepMind의 독점 모델들과 달리, DeepSeek은 Hugging Face와 GitHub에서 Apache 2.0 라이선스로 모델 가중치를 공개적으로 제공했다.​


자기 검증 프레임워크가 AI 추론 격차를 해결하다

이 모델은 최종 답변의 정확성보다 증명의 질을 우선시하는 새로운 자기 검증 프레임워크를 도입합니다. DeepSeek 연구진은 한 시스템이 수학적 증명을 생성하는 "증명자" 역할을 하고 다른 시스템이 추론을 면밀히 검토하는 "검토자" 역할을 하는 이중 모델 아키텍처를 설계했습니다. 회사의 기술 논문에 따르면, 이 접근 방식은 현재 AI 시스템의 중요한 한계를 해결합니다: "올바른 최종 답변이 올바른 추론 과정을 보장하지는 않는다".​

그룹 상대 정책 최적화(Group Relative Policy Optimization)를 기반으로 구축된 훈련 방법론은 단순히 정답에 보상을 주는 대신 증명이 완전하고 논리적으로 건전한지를 평가하는 검증자 우선 접근 방식을 사용합니다. IMO-ProofBench 벤치마크에서 DeepSeekMath-V2는 기본 증명에 대해 99%의 성공률을 달성하여 Google의 Gemini DeepThink의 89%를 크게 능가했습니다.​


중국, 오픈소스 AI에서 우위 확보

이번 출시는 중국이 글로벌 오픈소스 AI 시장에서 미국을 추월하면서 이루어졌습니다. 11월 말 MIT와 Hugging Face가 발표한 연구에 따르면, 중국에서 개발된 오픈 모델은 지난 1년간 전 세계 다운로드의 17%를 차지하여 처음으로 미국 개발자들의 15.8% 점유율을 넘어섰습니다. DeepSeek와 Alibaba의 Qwen 모델이 중국의 오픈 모델 다운로드를 주도하고 있습니다.

댓글 0
전체 1,366 / 81 페이지
HarvardBusinessReview는채용관리자들이면접중지원자가AI를사용하는지탐지하려고하기보다는,챗봇이복제할수없는인간의기술,즉감성지능과적응력을평가할수있도록면접을재설계해야한다고주장합니다.​이기사는다섯가지핵심역량을테스트할것을권장합니다:사회적신호를읽고신체언어변화에반응하기,명확한답이없는모호한시나리오를통해추론하기,비판적사고를드러내는명확화질문하기,대화가예상치못한방향으로전개될때적응하기,그리고그룹환경에서협력적문제해결능력보여주기.​이러한접근방식은현재99%의채용관리자가채용과정에서어떤형태로든AI를사용하고있으며,지원자들은실시간으로면접응답을생성하기위해ChatGPT와같은도구에점점더의존하고있는상황에서증가하는과제를해결합니다.
720 조회
0 추천
2025.11.21 등록
MITTechnologyReview는계획,추론및작업을독립적으로수행할수있는자율시스템인에이전틱AI가기존의운영사일로를해체하는통합데이터패브릭아키텍처를통해머신데이터를통합함으로써조직이디지털복원력을근본적으로재고할것을요구한다고보도했습니다.​Cisco의자회사인Splunk의KamHathi에따르면,전세계AI투자가2025년까지1조5천억달러에달할것으로예상됨에도불구하고,예기치않은상황에서서비스연속성과보안을보장할수있는조직의능력에대해확신을표명하는비즈니스임원은절반도되지않습니다.​인간이생성한콘텐츠로훈련된초기AI시스템과달리,에이전틱AI는장치와애플리케이션의로그,메트릭및텔레메트리와같은머신데이터에대한원활한접근을필요로하지만,현재이러한자율시스템을완전히활성화하는데필요한통합수준을달성하는조직은거의없으며,이는이상징후와부정확성의위험을초래합니다.
759 조회
0 추천
2025.11.21 등록
취리히에본사를둔로보틱스스타트업Flexion은전Nvidia연구원들이설립한회사로,휴머노이드로봇이다양한환경에서자율적으로작동할수있도록하는인공지능소프트웨어개발을위해시리즈A펀딩으로5천만달러를확보했습니다.이번라운드는DSTGlobalPartners가주도했으며,NVentures,Redalpine,ProsusVentures,MoonfireVentures가참여했습니다.​11월20일발표된이번펀딩으로Flexion은1월설립이후총5,735만달러의자본을조달했으며,이는베이에리어에미국본사를개설하고,31명으로구성된팀을확장하며,컴퓨팅인프라와로봇플릿을확대하는데사용될예정입니다.회사는연간로봇당소프트웨어라이선스모델을통해주요주문자상표부착생산(OEM)파트너들과함께자율플랫폼의상용화를가속화할계획입니다.​원격조작에서벗어나기Flexion은인간작업자가원격으로로봇을제어하는원격조작방식을지양하고,대신고성능물리시뮬레이션에서생성된합성데이터와강화학습기법을결합한방식을선호함으로써경쟁사들과차별화됩니다.ETH취리히에서수년간의연구를거쳐CTODavidHoeller,JulianNubert,FabianTischhauser와함께회사를공동설립한CEONikitaRudin은원격조작기반접근방식이"수십만시간의수동인간시연을필요로하며"이는근본적으로확장될수없다고주장합니다.​이회사의플랫폼은Rudin이설명하는"완전자율스택"을제공하며,언어수준추론,비전-언어-행동모션생성,트랜스포머기반전신제어기능을갖추고있어로봇이최소한의인간개입으로명령을이해하고새로운상황에적응할수있습니다.단일로봇형태에초점을맞춘경쟁사들과달리,Flexion의형태무관시스템은휴머노이드로봇,바퀴형플랫폼,다중팔시스템전반에걸쳐작동하도록설계되었습니다.​급증하는로봇공학투자Flexion의투자유치는로봇공학벤처캐피털에있어활발한한해동안이루어졌으며,Crunchbase데이터에따르면11월19일기준전세계적으로107억달러이상이투자되어이미2021년이후모든연도를넘어섰다.이분야는2025년2분기에만거래가치가88억달러로급증하여전분기대비170.5%증가했다.경쟁사인PhysicalIntelligence는최근56억달러의기업가치로6억달러를유치했으며,FigureAI와Apptronik을포함한다른휴머노이드로봇스타트업들도10억달러이상의기업가치를확보했다.​Redalpine의투자자PhilipKneis는Flexion이"스택에서가장어렵고방어가능한부분인로봇을위한공유두뇌구축"에집중하기때문에두각을나타냈다고말했다.ProsusVentures의SandeepBakshi는로봇기반모델개발자들이"결국시뮬레이션기반훈련을크게활용해야할필요가있기"때문에이스타트업의시뮬레이션우선접근방식이승리할수있는위치에있다고언급했다.
706 조회
0 추천
2025.11.21 등록
GoogleCEO순다르피차이는인공지능이결국최고경영자역할을수행할수있을것이라고말하며,11월18일공개된BBC인터뷰에서이직책을"언젠가AI가하기에아마도더쉬운일중하나"라고설명했다.​그의발언은11월17일출시된Google의가장진보된AI모델인Gemini3발표이후나왔으며,피차이는이것이복잡한작업을자율적으로수행할수있는시스템을향한전환점이라고말했다.CEO는12개월내에AI가질문에답하는것에서사용자를대신하여행동하는에이전트로진화하여선물쇼핑,투자결정평가,의료치료옵션검토와같은작업을처리하게될것이라고예측했다.​기술리더들사이에서커지는목소리Pichai는AI가리더십기능을자동화할수있다고인정하는임원들의확대되는그룹에합류했습니다.OpenAICEOSamAltman은11월4일팟캐스트에서AI가"몇년이내"에주요기업부서를운영할것으로예상한다고말했으며"OpenAI가AICEO가운영하는첫번째대기업이아니라면부끄러운일"이라고선언했습니다.KlarnaCEOSebastianSiemiatkowski는올해초AI가"내일을포함하여우리의모든일을할수있다"고쓰면서회사직원수를7,400명에서3,000명으로줄였습니다.​모든기술리더들이동의하는것은아닙니다.NvidiaCEOJensenHuang은AI가자신을대체할수있는지묻는질문에"절대아니다"라고답했지만,이기술이모든직업에영향을미칠것임을인정했습니다.​버블우려와일자리붕괴피차이는AI의급속한성장에"비합리성의요소들"이포함되어있다고경고했으며,버블이붕괴될경우"우리를포함한어떤회사도면역되지않을것"이라고말했다.그는AI를절대적으로신뢰해서는안된다고사용자들에게주의를주면서,시스템이여전히"오류가발생하기쉽다"고지적했다.​CEO는AI발전이일부직위를없애는동시에다른직위를변화시켜광범위한적응을요구할것이라고말했다.500명의CEO를대상으로한edX설문조사에서49%가자신의직무기능대부분또는전부가AI에의해자동화되어야한다고믿는것으로나타났다.
724 조회
0 추천
2025.11.21 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입