Loading...

AI 뉴스

DeepSeek의 수학 모델이 인간의 Putnam 점수를 넘어서다

페이지 정보

작성자 xtalfi
작성일 2025.11.29 17:59
507 조회
0 추천
0 비추천

본문

2245513521_ywnwo3.jpg

중국 AI 스타트업 DeepSeek은 목요일 오픈소스 수학적 추론 모델인 DeepSeekMath-V2를 공개했으며, 이 모델은 2024년 Putnam 수학 경시대회에서 120점 만점에 118점이라는 거의 완벽한 점수를 달성하여 인간 최고 점수인 90점을 능가했다. 6,850억 개의 매개변수를 가진 이 모델은 또한 International Mathematical Olympiad 2025와 Chinese Mathematical Olympiad 2024에서 금메달 수준의 성능을 달성했다.​

DeepSeekMath-V2가 IMO 수준 경시대회에서 금메달 등급을 달성한 최초의 오픈소스 모델이 되면서, 이번 출시는 AI 기반 수학적 추론의 전환점을 나타낸다. 올해 초 유사한 이정표를 달성한 OpenAI와 Google DeepMind의 독점 모델들과 달리, DeepSeek은 Hugging Face와 GitHub에서 Apache 2.0 라이선스로 모델 가중치를 공개적으로 제공했다.​


자기 검증 프레임워크가 AI 추론 격차를 해결하다

이 모델은 최종 답변의 정확성보다 증명의 질을 우선시하는 새로운 자기 검증 프레임워크를 도입합니다. DeepSeek 연구진은 한 시스템이 수학적 증명을 생성하는 "증명자" 역할을 하고 다른 시스템이 추론을 면밀히 검토하는 "검토자" 역할을 하는 이중 모델 아키텍처를 설계했습니다. 회사의 기술 논문에 따르면, 이 접근 방식은 현재 AI 시스템의 중요한 한계를 해결합니다: "올바른 최종 답변이 올바른 추론 과정을 보장하지는 않는다".​

그룹 상대 정책 최적화(Group Relative Policy Optimization)를 기반으로 구축된 훈련 방법론은 단순히 정답에 보상을 주는 대신 증명이 완전하고 논리적으로 건전한지를 평가하는 검증자 우선 접근 방식을 사용합니다. IMO-ProofBench 벤치마크에서 DeepSeekMath-V2는 기본 증명에 대해 99%의 성공률을 달성하여 Google의 Gemini DeepThink의 89%를 크게 능가했습니다.​


중국, 오픈소스 AI에서 우위 확보

이번 출시는 중국이 글로벌 오픈소스 AI 시장에서 미국을 추월하면서 이루어졌습니다. 11월 말 MIT와 Hugging Face가 발표한 연구에 따르면, 중국에서 개발된 오픈 모델은 지난 1년간 전 세계 다운로드의 17%를 차지하여 처음으로 미국 개발자들의 15.8% 점유율을 넘어섰습니다. DeepSeek와 Alibaba의 Qwen 모델이 중국의 오픈 모델 다운로드를 주도하고 있습니다.

댓글 0
전체 1,366 / 22 페이지
• 애플은 2026년 말 공개를 목표로, 코드명 N50인 AI 기반 스마트 글라스를 개발 중이며, 이는 메타의 레이밴(Ray-Ban) 협업 제품과 경쟁하게 될 것으로 알려졌다. 이 제품은 개편된 시리를 통한 음성 기반 AI와, 디스플레이 없이도 시각 지능을 구현하기 위한 다수의 카메라를 탑재할 예정이라고 사안에 정통한 관계자들은 전했다.• 회사는 글라스 프로젝트에 자원을 집중하기 위해 더 가벼운 버전의 비전 프로(Vision Pro) 후속 모델 계획을 보류했으며, 이 스마트 글라스는 애플 워치처럼 아이폰과 페어링되고, 전력 효율에 최적화된 S-클래스 칩을 사용할 예정이다. 출하는 2027년 시작이 예상된다.• 애플은 또한 비주얼 룩 업(Visual Look Up)과 상황 인지형 알림 등 기능을 갖춘 AI 강화 에어팟(AirPods)을 선보일 계획이며, 이 시장에서 현재 메타가 약 60%의 점유율을 차지하고 있고, 애널리스트들은 AI 글라스 분야가 2030년까지 매년 100% 이상 성장할 것으로 전망하고 있다.
365 조회
0 추천
2025.12.22 등록
삼성전자가 엔비디아의 차세대 HBM4 테스트에서 구동 속도와 전력 효율 면에서 ‘최우수’ 평가를 받으며, 내년 공급 물량의 30% 이상을 차지할 것으로 전망된다.삼성전자의 HBM4는 초당 11Gbps 이상의 속도를 구현하고 전력 효율을 전 세대 대비 40% 개선했으며, 올해 3분기 HBM 시장 점유율 22%로 마이크론을 제치고 2위를 탈환했다.HBM4는 내년 하반기 출시 예정인 엔비디아의 차세대 AI 가속기 ‘베라 루빈’에 탑재될 핵심 부품으로, 삼성전자는 1분기 정식 계약 체결 후 2분기부터 본격 공급을 시작할 예정이다.
366 조회
0 추천
2025.12.22 등록
Nvidia는 40,000시간의 게임플레이 영상으로 학습된 오픈소스 AI 모델 NitroGen을 공개했으며, 이는 1,000개 이상의 비디오 게임을 플레이할 수 있고 처음 보는 게임에서 처음부터 학습된 모델 대비 작업 성공률이 52% 향상되었습니다.이 모델은 Nvidia의 GROOT N1.5 로봇공학 아키텍처를 기반으로 구축되었으며, 연구진은 이 기술이 예측 불가능한 환경에서 작동하는 로봇을 포함한 실제 응용 분야를 발전시킬 수 있다고 말하며, 모든 데이터셋, 코드 및 모델 가중치를 공개적으로 공개했습니다.이 발표는 게임 커뮤니티에서 경쟁적인 온라인 게임에서의 잠재적 오용에 대한 우려를 불러일으켰으며, 업계 데이터에 따르면 게이머의 80%가 이미 치팅을 경험하고 있고 이 AI는 인간 플레이어와 봇을 구별하기 어렵게 만들 수 있습니다.
361 조회
0 추천
2025.12.22 등록
• 아마존의 차세대 음성 비서 '알렉사 플러스'가 기존 에코 기기 사용자에게도 확대 적용• 프라임 회원은 "알렉사, 업그레이드"라고 말하면 알렉사 플러스로 전환 가능• 신형 에코 기기와 웹에서 순차적으로 출시 중이나, 과연 진정한 '업그레이드'인지는 의문아마존의 차세대 음성 비서가 서서히 보급되고 있다. 신형 에코 기기에 탑재되어 출시되고 있으며, 일부 사용자들에게는 웹을 통해서도 제공되고 있다. 이제 기존 에코 기기를 보유한 프라임 회원들도 "알렉사, 업그레이드"라고 말하면 알렉사 플러스를 이용할 수 있게 되었다. 다만 남은 질문은 하나다. 이것이 과연 진정한 업그레이드인가?
350 조회
0 추천
2025.12.22 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입