AI 뉴스

DeepSeek의 수학 모델이 인간의 Putnam 점수를 넘어서다

페이지 정보

작성자 xtalfi
작성일 2025.11.29 17:59
538 조회
0 추천
0 비추천

본문

2245513521_ywnwo3.jpg

중국 AI 스타트업 DeepSeek은 목요일 오픈소스 수학적 추론 모델인 DeepSeekMath-V2를 공개했으며, 이 모델은 2024년 Putnam 수학 경시대회에서 120점 만점에 118점이라는 거의 완벽한 점수를 달성하여 인간 최고 점수인 90점을 능가했다. 6,850억 개의 매개변수를 가진 이 모델은 또한 International Mathematical Olympiad 2025와 Chinese Mathematical Olympiad 2024에서 금메달 수준의 성능을 달성했다.​

DeepSeekMath-V2가 IMO 수준 경시대회에서 금메달 등급을 달성한 최초의 오픈소스 모델이 되면서, 이번 출시는 AI 기반 수학적 추론의 전환점을 나타낸다. 올해 초 유사한 이정표를 달성한 OpenAI와 Google DeepMind의 독점 모델들과 달리, DeepSeek은 Hugging Face와 GitHub에서 Apache 2.0 라이선스로 모델 가중치를 공개적으로 제공했다.​


자기 검증 프레임워크가 AI 추론 격차를 해결하다

이 모델은 최종 답변의 정확성보다 증명의 질을 우선시하는 새로운 자기 검증 프레임워크를 도입합니다. DeepSeek 연구진은 한 시스템이 수학적 증명을 생성하는 "증명자" 역할을 하고 다른 시스템이 추론을 면밀히 검토하는 "검토자" 역할을 하는 이중 모델 아키텍처를 설계했습니다. 회사의 기술 논문에 따르면, 이 접근 방식은 현재 AI 시스템의 중요한 한계를 해결합니다: "올바른 최종 답변이 올바른 추론 과정을 보장하지는 않는다".​

그룹 상대 정책 최적화(Group Relative Policy Optimization)를 기반으로 구축된 훈련 방법론은 단순히 정답에 보상을 주는 대신 증명이 완전하고 논리적으로 건전한지를 평가하는 검증자 우선 접근 방식을 사용합니다. IMO-ProofBench 벤치마크에서 DeepSeekMath-V2는 기본 증명에 대해 99%의 성공률을 달성하여 Google의 Gemini DeepThink의 89%를 크게 능가했습니다.​


중국, 오픈소스 AI에서 우위 확보

이번 출시는 중국이 글로벌 오픈소스 AI 시장에서 미국을 추월하면서 이루어졌습니다. 11월 말 MIT와 Hugging Face가 발표한 연구에 따르면, 중국에서 개발된 오픈 모델은 지난 1년간 전 세계 다운로드의 17%를 차지하여 처음으로 미국 개발자들의 15.8% 점유율을 넘어섰습니다. DeepSeek와 Alibaba의 Qwen 모델이 중국의 오픈 모델 다운로드를 주도하고 있습니다.

댓글 0
전체 1,366 / 16 페이지
많은기업이인건비를줄이기위해인공지능(AI)도입을서두르고있지만,직원의역할을지나치게단순화해판단하는'도어맨의오류'에빠져오히려비용이증가하는부작용을겪고있습니다.이는겉으로드러난핵심업무만자동화하면인간을완전히대체할수있다는잘못된믿음에서비롯됩니다.실제로AI상담원을도입했던금융권이나패스트푸드체인등에서고객불만이폭증하고서비스품질이저하되는사례가잇따르고있습니다.인간직원이제공하던섬세한응대나맥락이해같은'보이지않는가치'가사라지면서,결국해고했던직원을복귀시키거나서비스를재검토하는등추가비용을지불하게된것입니다.전문가들은AI가인간을완전히대체하기보다인간의판단력과결합될때가장큰효과를낼수있다고강조합니다.효율성만을기준으로기술을도입하기에앞서,해당직무가실제현장에서어떤복합적인가치를창출하는지깊이이해하는능력이기업경영의핵심과제로떠오르고있습니다.
345 조회
0 추천
2025.12.28 등록
어원학자AdamAleksic은TED강연에서알고리즘과AI는중립적인도구가아니라수익중심플랫폼의이익을위해현실을적극적으로왜곡하며,사람들이인식하지못하는방식으로언어,문화적트렌드,정체성을무의식적으로재구성한다고주장한다.360,000개이상의YouTube동영상과771,000개의팟캐스트에피소드를분석한연구에따르면,ChatGPT가자주사용하는단어들—챗봇이나이지리아훈련작업자들로부터습득했을가능성이있는“delve”를포함하여—이해당도구의출시이후자발적인구어대화에서크게증가한것으로나타났다.Spotify는자사알고리즘에서유사한청취자들의신흥클러스터를식별하고“hyperpop”재생목록을만들었으며,이는미학적방향을제시하고음악가들이hyperpop음악을만들도록촉진했다.이는플랫폼이알고리즘적현실표현이현실그자체가되는자기강화피드백루프를어떻게만드는지를보여준다.
340 조회
0 추천
2025.12.28 등록
Wired는2026년이OpenAI의GPT-5가아닌Alibaba의QwenAI모델에의해주도될것이라고선언했습니다.이는2025년8월에출시된미국모델들이기본적인오류를겪고기대에미치지못하는실망스러운결과를보인데따른것입니다.중국AI모델다운로드는2025년7월HuggingFace에서미국모델을추월했으며,Qwen은전세계적으로두번째로많이사용되는오픈모델이되었고Airbnb,Nvidia,심지어Meta로부터도새로운모델훈련을위해채택되었습니다.기사에따르면,Qwen의부상은쉬운맞춤화를가능하게하는오픈웨이트아키텍처,NeurIPS2025에서최우수논문상을받은투명한연구관행,그리고스마트안경부터전기차대시보드에이르는애플리케이션에서의실제배포에서비롯된것입니다.
354 조회
0 추천
2025.12.28 등록
소형모듈식원자로(SMR)는기존원전의위험성을안고있으면서도규모의경제를실현하지못해실제경제성은오히려떨어진다는전문가들의경고가나오고있습니다.실제로미국최초의SMR사업이었던뉴스케일(NuScale)프로젝트는건설비용이초기예상보다3배가까이폭등하며작년11월에최종적으로좌초되었습니다.구글과아마존등빅테크기업들이AI데이터센터전력확보를위해SMR에투자하고있으나,재생에너지대비높은비용과기술적실체부족에대한회의론은여전히지속되고있습니다.
342 조회
0 추천
2025.12.28 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입