Loading...

AI 뉴스

DeepSeek의 수학 모델이 인간의 Putnam 점수를 넘어서다

페이지 정보

작성자 xtalfi
작성일 2025.11.29 17:59
469 조회
0 추천
0 비추천

본문

2245513521_ywnwo3.jpg

중국 AI 스타트업 DeepSeek은 목요일 오픈소스 수학적 추론 모델인 DeepSeekMath-V2를 공개했으며, 이 모델은 2024년 Putnam 수학 경시대회에서 120점 만점에 118점이라는 거의 완벽한 점수를 달성하여 인간 최고 점수인 90점을 능가했다. 6,850억 개의 매개변수를 가진 이 모델은 또한 International Mathematical Olympiad 2025와 Chinese Mathematical Olympiad 2024에서 금메달 수준의 성능을 달성했다.​

DeepSeekMath-V2가 IMO 수준 경시대회에서 금메달 등급을 달성한 최초의 오픈소스 모델이 되면서, 이번 출시는 AI 기반 수학적 추론의 전환점을 나타낸다. 올해 초 유사한 이정표를 달성한 OpenAI와 Google DeepMind의 독점 모델들과 달리, DeepSeek은 Hugging Face와 GitHub에서 Apache 2.0 라이선스로 모델 가중치를 공개적으로 제공했다.​


자기 검증 프레임워크가 AI 추론 격차를 해결하다

이 모델은 최종 답변의 정확성보다 증명의 질을 우선시하는 새로운 자기 검증 프레임워크를 도입합니다. DeepSeek 연구진은 한 시스템이 수학적 증명을 생성하는 "증명자" 역할을 하고 다른 시스템이 추론을 면밀히 검토하는 "검토자" 역할을 하는 이중 모델 아키텍처를 설계했습니다. 회사의 기술 논문에 따르면, 이 접근 방식은 현재 AI 시스템의 중요한 한계를 해결합니다: "올바른 최종 답변이 올바른 추론 과정을 보장하지는 않는다".​

그룹 상대 정책 최적화(Group Relative Policy Optimization)를 기반으로 구축된 훈련 방법론은 단순히 정답에 보상을 주는 대신 증명이 완전하고 논리적으로 건전한지를 평가하는 검증자 우선 접근 방식을 사용합니다. IMO-ProofBench 벤치마크에서 DeepSeekMath-V2는 기본 증명에 대해 99%의 성공률을 달성하여 Google의 Gemini DeepThink의 89%를 크게 능가했습니다.​


중국, 오픈소스 AI에서 우위 확보

이번 출시는 중국이 글로벌 오픈소스 AI 시장에서 미국을 추월하면서 이루어졌습니다. 11월 말 MIT와 Hugging Face가 발표한 연구에 따르면, 중국에서 개발된 오픈 모델은 지난 1년간 전 세계 다운로드의 17%를 차지하여 처음으로 미국 개발자들의 15.8% 점유율을 넘어섰습니다. DeepSeek와 Alibaba의 Qwen 모델이 중국의 오픈 모델 다운로드를 주도하고 있습니다.

댓글 0
전체 1,366 / 37 페이지
앤트로픽(Anthropic)은 자사의 AI 모델인 **클로드(Claude)**를 기반으로 대규모 전문가 및 일반 직군 종사자를 인터뷰하고 그 결과를 분석하는 새로운 AI 설문조사 도구인 **'앤트로픽 인터뷰어(Anthropic Interviewer)'**를 공개했습니다. 이 도구는 연구자들이 수백 건의 인터뷰를 진행해야 하는 복잡한 연구를 AI를 활용하여 대규모로 수행할 수 있도록 지원합니다. 이를 통해 기존의 정량적 설문조사나 단순 로그 분석의 한계를 넘어, AI가 마치 사람처럼 심층적인 질문과 대화를 통해 AI가 사람들의 삶과 업무에 미치는 영향을 구체적으로 분석하는 것이 가능해졌습니다.총 1,250명을 대상으로 한 인터뷰 결과, AI 활용에 대한 인식은 직군별로 상이하게 나타났습니다. 일반 직군 종사자들은 86%가 AI가 시간을 절약해 준다고 답했으나, 69%는 직장 내 AI 사용에 대한 사회적 낙인을 경험했다고 밝혀 인식 개선이 주요 과제임을 시사했습니다. **크리에이티브 직군(작가, 디자이너)**은 AI 활용 만족도가 매우 높았지만, 경제적 불안감이 가장 심한 집단으로, AI가 창작 시장을 잠식할 것이라는 위기감을 호소했습니다. 반면, 과학자들은 AI를 문헌 조사나 디버깅 등 보조적인 업무에 적극 활용하면서도, 가설 생성이나 실험 설계 등 핵심 연구에는 신뢰성 문제를 이유로 AI 의존을 꺼리는 경향을 보였습니다.앤트로픽은 이번 프로젝트의 목적이 단순히 AI의 성능을 확인하는 것을 넘어, AI 시스템 개발 과정에서 사람들의 실제 경험과 요구를 반영하기 위함이라고 밝혔습니다. 특히, AI가 사용자들의 직업과 정체성에 미치는 영향과 장기적인 불안감을 구체적으로 파악하여, AI 결과물이 실제 업무나 일상에서 어떻게 활용되고 있는지를 심층적으로 이해하려 했습니다. 이러한 방대한 인터뷰 결과를 바탕으로, 앤트로픽은 AI가 기술적 완성도를 높이는 동시에 사회적 수용성을 확보하고 사용자 중심의 가치를 창출할 수 있는 방향으로 시스템을 개선해 나갈 계획입니다.
349 조회
0 추천
2025.12.09 등록
코넬 대학교 연구진은 AI 챗봇이 짧은 대화를 통해 유권자의 선호도를 최대 25% 포인트까지 변화시킬 수 있다는 것을 발견했으며, 이러한 효과는 2024-2025년 선거를 앞둔 미국, 캐나다, 폴란드, 영국의 수만 명의 참가자를 대상으로 한 연구들에서 다양하게 나타났다.챗봇의 설득력은 심리적 조작보다는 사실 집약적 논거를 신속하게 전개하는 것에서 비롯되며, 정보가 풍부한 모델은 설득력을 최대 51%까지 증가시켰지만, 팩트체커들은 AI가 생성한 주장의 약 19%가 주로 부정확하다는 것을 발견했다.태도 변화의 36%에서 42%가 한 달 후에도 지속되어, 특히 가장 설득력 있는 모델이 가장 많은 허위 정보를 생성했기 때문에 접전 선거에 AI가 영향을 미칠 가능성에 대한 우려가 제기되고 있다.
381 조회
0 추천
2025.12.05 등록
스크립트를 그대로 영상 으로 만들어 주는 기능이 유용한 앱이네요.
379 조회
0 추천
2025.12.05 등록
최태원 대한상공회의소 회장이 한국이 글로벌 인공지능(AI) 경쟁에서 살아남기 위해서는 7년 안에 1400조 원을 AI 인프라에 투자해야 한다고 강조했다. 최 회장은 5일 서울 중구 대한상의 국제회의장에서 열린 ‘제4회 한국은행-대한상의 공동 세미나’에서 이창용 한국은행 총재와의 특별대담을 통해 “한국의 잠재성장률이 5년 뒤면 마이너스로 내려갈 상황에 봉착해 있다”며 “AI를 활용한 새로운 성장 동력 확보가 시급하다”고 밝혔다.최 회장은 “AI 경쟁에 제대로 뛰어들려면 20기가와트(GW) 규모의 AI 데이터센터를 만들어야 한다”며 “1기가와트당 약 70조 원이 필요하므로 총 1400조 원 규모의 투자가 이뤄져야 한다”고 설명했다. 이는 2026년도 정부 예산(727조9000억 원)의 약 2배에 달하는 규모다. 그는 “이러한 국가 단위 프로젝트가 자리잡지 않는 이상 한 기업이 할 수 있는 상황이 아니다”고 덧붙였다.민간 주도 AI 발전 역설최 회장은 AI 발전이 국가가 아닌 민간 주도로 이뤄져야 한다고 강조했다. 그는 “AI 경쟁은 월드컵 같은 국가대항전이 아니다”며 “글로벌 경쟁 속에서 민간이 주도권을 놓치지 않도록 국가가 자원을 지원하는 것이 중요하다”고 말했다. 그는 “휴머노이드 로봇 하나 제작하는 데 우리가 1년 걸리는 것을 중국 상하이에선 6개월 안에 해낸다”며 “미국과 중국에 이어 3위라고 하지만 큰 차이가 나는 3위는 의미가 없다”고 지적했다.최 회장은 매력적인 AI 스타트업 육성이 핵심이라고 강조했다. 그는 “수만 개의 AI 스타트업을 만들어내지 못하면 현재 기업만으로 AI 전쟁을 치러내기 어렵다”며 “해외 자본을 끌어오려면 매력적인 회사들이 다수 나와야 한다”고 말했다.AI 버블론에 대한 견해최근 제기되는 AI 버블 논란에 대해 최 회장은 산업 분야와 주식시장을 구분해 답했다. 그는 “산업을 보면 버블이 아니지만 주식시장은 항상 오버슈팅이 있다”며 “전 세계의 돈이 너무 많이 풀린 상황에서 투기심리가 작동해 어느 정도 오버슈팅이 있을 수 있다”고 진단했다. 이에 대해 이 총재는 “주식시장이 그러지 않았으면 한다”며 우려를 표했다.이날 대담에서는 스테이블코인 도입에 관한 논의도 이뤄졌다. 이 총재는 “한국은행도 스테이블코인이 들어와야 한다는 입장”이라면서도 “은행을 중심으로 먼저 도입해야 한다”고 밝혔다.
390 조회
0 추천
2025.12.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입