Loading...

AI 뉴스

DeepSeek의 수학 모델이 인간의 Putnam 점수를 넘어서다

페이지 정보

작성자 xtalfi
작성일 2025.11.29 17:59
510 조회
0 추천
0 비추천

본문

2245513521_ywnwo3.jpg

중국 AI 스타트업 DeepSeek은 목요일 오픈소스 수학적 추론 모델인 DeepSeekMath-V2를 공개했으며, 이 모델은 2024년 Putnam 수학 경시대회에서 120점 만점에 118점이라는 거의 완벽한 점수를 달성하여 인간 최고 점수인 90점을 능가했다. 6,850억 개의 매개변수를 가진 이 모델은 또한 International Mathematical Olympiad 2025와 Chinese Mathematical Olympiad 2024에서 금메달 수준의 성능을 달성했다.​

DeepSeekMath-V2가 IMO 수준 경시대회에서 금메달 등급을 달성한 최초의 오픈소스 모델이 되면서, 이번 출시는 AI 기반 수학적 추론의 전환점을 나타낸다. 올해 초 유사한 이정표를 달성한 OpenAI와 Google DeepMind의 독점 모델들과 달리, DeepSeek은 Hugging Face와 GitHub에서 Apache 2.0 라이선스로 모델 가중치를 공개적으로 제공했다.​


자기 검증 프레임워크가 AI 추론 격차를 해결하다

이 모델은 최종 답변의 정확성보다 증명의 질을 우선시하는 새로운 자기 검증 프레임워크를 도입합니다. DeepSeek 연구진은 한 시스템이 수학적 증명을 생성하는 "증명자" 역할을 하고 다른 시스템이 추론을 면밀히 검토하는 "검토자" 역할을 하는 이중 모델 아키텍처를 설계했습니다. 회사의 기술 논문에 따르면, 이 접근 방식은 현재 AI 시스템의 중요한 한계를 해결합니다: "올바른 최종 답변이 올바른 추론 과정을 보장하지는 않는다".​

그룹 상대 정책 최적화(Group Relative Policy Optimization)를 기반으로 구축된 훈련 방법론은 단순히 정답에 보상을 주는 대신 증명이 완전하고 논리적으로 건전한지를 평가하는 검증자 우선 접근 방식을 사용합니다. IMO-ProofBench 벤치마크에서 DeepSeekMath-V2는 기본 증명에 대해 99%의 성공률을 달성하여 Google의 Gemini DeepThink의 89%를 크게 능가했습니다.​


중국, 오픈소스 AI에서 우위 확보

이번 출시는 중국이 글로벌 오픈소스 AI 시장에서 미국을 추월하면서 이루어졌습니다. 11월 말 MIT와 Hugging Face가 발표한 연구에 따르면, 중국에서 개발된 오픈 모델은 지난 1년간 전 세계 다운로드의 17%를 차지하여 처음으로 미국 개발자들의 15.8% 점유율을 넘어섰습니다. DeepSeek와 Alibaba의 Qwen 모델이 중국의 오픈 모델 다운로드를 주도하고 있습니다.

댓글 0
전체 1,366 / 19 페이지
전통적인 뇌 지도가 도마 위에 오르다Nature Neuroscience 논문은 뇌를 개별적인 기능 영역으로 나누는 한 세기 된 관행에 도전하고 있으며, 이는 신경과학자들이 인지를 연구하는 방식의 초석이었다. 연구자들에 따르면, 세포 구조와 연결 패턴과 같은 뇌 기능의 주요 결정 요인들은 일관된 구분을 거의 만들어내지 않는다. "뇌 영역 자체는 동등하게 중요한 여러 조직 원리 중 하나일 뿐이며, 다른 원리로는 거시적 구배, 분산 네트워크, 층, 기둥 및 패치가 있다"고 저자들은 기술한다.nature+4​ 이 비판은 해부학을 넘어 확장된다. 많은 인지 기능들은 특정 영역에 국한되기보다는 분산된 뇌 네트워크에 걸쳐 구현되는 것으로 보인다. 이는 특정 뇌 영역을 특정 정신 능력과 연결하는 관행—신경과학 교과서와 미디어 보도의 주요 내용—이 인지가 실제로 작동하는 방식을 지나치게 단순화할 수 있음을 시사한다.bioengineer+1​ https://www.nature.com/articles/s41593-025-02166-z https://bioengineer.org/rethinking-brain-area-centrality-in-functional-organization/ https://www.nature.com/neuro/articles?year=2025 https://x.com/PessoaBrain/status/2003494177645158445 https://www.nature.com/subjects/cognitive-neuroscience​왜 디지털 AI는 의식을 가질 수 없는가12월 17일에 발표된 생물학적 계산주의 논문은 또 다른 정설을 겨냥한다. 즉, 의식은 물리적 기질과 무관하게, 올바른 정보 처리 패턴에만 의존한다는 가정이다. 밀린코비치와 아루는 생물학적 뇌가 디지털 시스템과는 근본적으로 다른 유형의 계산을 수행한다고 주장한다.studyfinds+4​ 그들의 틀에 따르면, 뇌는 현재의 AI에는 없는 세 가지 핵심 특성을 보여준다. 연속적인 역학과 이산적 사건을 결합한 하이브리드 계산, 알고리즘과 물리적 구현을 분리할 수 없는 “스케일-불가분(scale-inseparable)” 처리, 그리고 계산 구조 자체를 형성하는 대사적 제약이다. 연구자들은 “알고리즘이 곧 기질이다”라고 적으며, 물리적 조직은 단지 계산을 지탱하는 것이 아니라 바로 그 자체가 계산을 구성한다고 주장한다.neurosciencenews+3​ 논문은, 가지를 뻗은 수상돌기를 가진 단일 생물학적 뉴런이 8층 인공 신경망에 맞먹는 계산을 수행할 수 있다고 지적한다. 이러한 능력은 이온 흐름, 전기장, 막 전위와 같이 실시간으로 전개되는 연속적인 물리 과정에서 비롯되며, 이들은 이산적인 디지털 근사로는 복제될 수 없다고 한다.phys+3​ “현재 AI 아키텍처를 단순히 확장하는 것으로는 이 간극을 메울 수 없다”라고 저자들은 결론내린다. 인공 의식을 구축하려면, 생물학적 뇌를 특징짓는 연속적이고, 스케일이 통합되어 있으며, 대사적으로 내재화된 처리를 수행할 수 있는, 근본적으로 다른 물리적 기질이 필요할지도 모른다.eurekalert+3​ https://studyfinds.org/what-makes-brains-conscious-that-computers-lack/ https://neurosciencenews.com/consciousness-computing-ai-30068/ https://phys.org/news/2025-12-path-consciousness-biological.html https://www.linkedin.com/posts/borjan-milinkovic-05952b337_neuroscience-biobehavioral-reviews-activity-7407474586876792832-GhPs https://www.eurekalert.org/news-releases/1110849​과학과 기술에 대한 시사이 논문들은 함께 신경과학이 개별적인 뇌 영역과 수십 년간 이 분야를 지배해온 컴퓨터 은유를 넘어서야 할 필요가 있음을 시사합니다. AI 개발에 있어서 그 함의는 냉엄합니다: 기계 의식을 달성하기 위해서는 단순히 더 나은 알고리즘뿐만 아니라 생물학적 조직처럼 작동하는 완전히 새로운 유형의 컴퓨팅 하드웨어가 필요할 것입니다.studyfinds+3​ Milinkovic와 Aru의 논문은 실험실에서 배양된 신경 배양체와 유체 멤리스터와 같은 신흥 기술을 잠재적 대안으로 지적하지만, 그러한 시스템이 의식을 지원할 수 있는지 여부는 여전히 불확실합니다. Hayden과 동료들은 전통적인 구획화와 함께 그래디언트, 네트워크, 미세 규모 구조 등 여러 조직 원리를 통합하는 신경과학 연구를 요구합니다.neurosciencenews+3​ https://studyfinds.org/what-makes-brains-conscious-that-computers-lack/ https://neurosciencenews.com/consciousness-computing-ai-30068/ https://phys.org/news/2025-12-path-consciousness-biological.html https://www.eurekalert.org/news-releases/1110849 https://www.nature.com/articles/s41593-025-02166-z https://bioengineer.org/rethinking-brain-area-centrality-in-functional-organization/
341 조회
0 추천
2025.12.26 등록
MIT Technology Review는 AI로 생성된 비디오 콘텐츠를 처음에는 저품질 "slop"으로 치부했으나, 추가 조사 결과 크리에이터들이 OpenAI의 Sora, Google의 Veo, Runway와 같은 도구를 사용하여 기술과 실험이 필요한 의도적이고 종종 초현실적인 예술 작품을 제작하는 더 미묘한 창작 생태계가 있음을 발견했다고 보도했습니다.technologyreview​ AI 비디오 크리에이터들과의 인터뷰에 따르면 매력적인 콘텐츠를 제작하는 데는 클립당 수 시간의 작업이 필요하며, Daryl Anselmo와 같은 아티스트는 4년간의 일일 AI 실험을 갤러리 전시회로 편집하고, 다른 이들은 수백만 명의 팔로워를 확보한 반복 캐릭터 프랜차이즈를 구축하고 있습니다.inkl+1​ Adobe 설문조사에 따르면 전 세계 크리에이터의 86%가 현재 생성형 AI 도구를 사용하고 있으며, Brookings 연구에서는 2022년 새로운 AI 도구 출시 이후 AI에 노출된 분야의 프리랜서들이 계약 2% 감소와 수입 5% 하락을 경험했다고 밝혀 이 기술의 파괴적인 경제적 영향을 강조했습니다.biz.chosun+2​ https://www.technologyreview.com/2025/12/23/1130396/how-i-learned-to-stop-worrying-and-love-ai-slop/ https://www.inkl.com/news/the-ais-have-it-adobe-report-reveals-86-of-creators-use-creative-generative-ai https://biz.chosun.com/en/en-it/2025/11/04/FRVYHP2MVBDB3PWZ5NBT5C3K6M/ https://www.brookings.edu/articles/is-generative-ai-a-job-killer-evidence-from-the-freelance-market/ https://www.cnbc.com/2024/12/09/openai-releases-sora-its-buzzy-ai-video-generation-tool.html https://mashable.com/article/ai-slop-tiktok-fyp-trending-social-media-why https://www.reddit.com/r/VEO3/comments/1m6oc2v/veo_vs_sora_runway_ai_video_generators_for_quick/ https://www.transparencycoalition.ai/news/openai-launches-sora-video-generator-aims-to-kickstart-ai-video-era https://www.reddit.com/r/Futurology/comments/1hyt8dm/aigenerated_slop_is_slowly_killing_the_internet/ https://www.youtube.com/watch?v=US2gO7UYEfY https://www.axios.com/2024/12/09/openai-sora-video-ai-tool https://en.wikipedia.org/wiki/AI_slop https://www.youtube.com/watch?v=g5CWQXoK7wM https://www.theguardian.com/technology/2024/dec/09/openai-ai-video-generator-sora-publicly-available https://hawkemedia.com/insights/ai-slop/ https://www.youtube.com/watch?v=eZvSwOnnLrs https://www.cnbc.com/2025/09/30/openai-sora-ai-video-generator-us-canada.html https://www.theguardian.com/commentisfree/2025/apr/21/ai-slop-artificial-intelligence-social-media https://deepmind.google/models/veo/ https://openai.com/index/sora-is-here/ https://www.cnet.com/tech/services-and-software/ai-slop-has-turned-social-media-into-an-antisocial-wasteland/ https://www.youtube.com/watch?v=NmoZvPt0a78 https://openai.com/index/sora-2/ https://www.searchenginepeople.com/blog/ai-slop-and-the-rise-of-slop-culture.html https://www.today.com/news/bunnies-jumping-trampoline-viral-video-ai-concern-rcna223637 https://tech.yahoo.com/ai/articles/ais-adobe-report-reveals-86-153703401.html https://www.reddit.com/r/Bunnies/comments/1mjvetv/a_viral_security_cam_clip_of_rabbits_bouncing_on/ https://www.abc.net.au/news/2025-11-25/ai-slop-named-macquarie-dictionary-word-of-the-year-2025/106047682 https://www.youtube.com/watch?v=9O-8kAnBL2s https://dictionary.cambridge.org/us/dictionary/english/slop https://news.adobe.com/news/2025/10/adobe-max-2025-creators-survey https://www.facebook.com/thedodosite/videos/viral-trampoline-animal-videos-show-how-ai-can-go-really-wrong/4068853723366784/ https://www.linkedin.com/posts/kingajentetics_cambridge-dictionary-adds-new-definition-activity-7344348856932798464-g-ME https://www.netinfluencer.com/86-percent-of-global-creators-now-leverage-ai-tools-driving-growth-in-creator-economy-adobe-report/ https://www.youtube.com/watch?v=ydycD3iMhvc https://www.cambridge.org/news-and-insights/cambridge-dictionary-tracks-new-ai-words https://blog.adobe.com/en/publish/2024/10/08/adobes-ai-creative-frontier-study-reveals-creators-views-opportunities-risks-generative-ai https://www.tiktok.com/@rachelthecatlovers/video/7531584773500751118 https://www.thebookseller.com/news/cambridge-dictionary-adds-new-definition-for-slop-to-reflect-low-quality-content-created-by-ai https://www.linkedin.com/posts/paulgreenberg_the-creator-economy-has-embraced-generative-activity-7389380797801062400-VsWW https://www.youtube.com/shorts/vTPx_muLksc https://www.bbc.com/news/articles/c5y0g79xevxo https://people.com/openai-bans-martin-luther-king-jr-deepfakes-following-racist-videos-11832092 https://builtin.com/articles/job-market-ai-impact-yale-brookings-study https://edition.cnn.com/2025/10/17/tech/openai-mlk-sora-pause https://www.brookings.edu/articles/the-effects-of-ai-on-firms-and-workers/ https://www.cnn.com/2025/10/17/tech/openai-mlk-sora-pause https://www.brookings.edu/articles/new-data-show-no-ai-jobs-apocalypse-for-now/ https://fortune.com/2025/10/17/openai-sora-martin-luther-king-deepfakes-foolishness-direspectful/ https://www.facebook.com/businessinsider/posts/brookings-says-that-ai-could-initially-boost-wages-but-then-drive-them-down-as-a/1210304244301191/ https://www.cnbc.com/2025/10/17/open-ai-sora-mlk-jr-disrespectful-deepfakes.html https://www.brookings.edu/articles/how-are-americans-using-ai-evidence-from-a-nationwide-survey/ https://www.npr.org/2025/10/17/nx-s1-5577869/sora-block-videos-mlk https://www.linkedin.com/posts/brookings-metro_ai-generativeai-aiadoption-activity-7379252760019632129-73QS https://mashable.com/article/openai-marthin-luther-king-sora-offensive-memes-backlash https://www.facebook.com/techinsider/posts/brookings-says-that-ai-could-initially-boost-wages-but-then-drive-them-down-as-a/1211787024154105/ https://www.yahoo.com/news/articles/openais-sora-2-app-suspends-173232838.html https://budgetlab.yale.edu/research/evaluating-impact-ai-labor-market-current-state-affairs https://www.reddit.com/r/technology/comments/1o8wpy8/openai_pauses_sora_video_generations_of_martin/
343 조회
0 추천
2025.12.26 등록
Pendo의 수석 제품 디자이너인 Brian Greenbaum은 육아휴직 중 보낸 단 하나의 Slack 메시지로 회사 전체의 변화를 촉발시킨 후, 전체 제품 조직에 걸쳐 AI 도입을 이끌어내기 위한 실용적인 플레이북을 공유합니다.lennysnewsletter​ 그의 접근 방식은 동기식 실습 워크숍과 비동기식 학습 기회를 결합했으며, 법무, 보안, 재무 팀과 협력하여 명확한 정책을 수립함으로써 AI 도구 사용을 위한 "황금 경로"를 확립했습니다.lennysnewsletter​ 이 이니셔티브는 Greenbaum의 개인 기여자 역할을 넘어 그의 경력을 변화시켰으며, 회사 전략에 영향을 미치고 조직의 AI 챔피언으로 자리매김할 수 있는 기회를 열어주었습니다—이는 AI 도입을 주도하는 것이 어떻게 중요한 경력 가속기 역할을 할 수 있는지를 보여줍니다.lennysnewsletter​ https://www.lennysnewsletter.com/p/how-to-get-your-whole-team-excited https://www.lennysnewsletter.com/p/this-week-on-how-i-ai-how-to-get
342 조회
0 추천
2025.12.26 등록
Nate's Newsletter는 Claude Code가 오해의 소지가 있는 이름이라고 주장하는데, Anthropic의 12월 릴리스는 소프트웨어 개발이 아니라 브라우저 자동화, Slack 통합, 모바일 위임, 그리고 비기술 사용자들이 코드 작성 없이 활용할 수 있는 조직 워크플로우 도구에 초점을 맞췄기 때문이다.natesnewsletter.substack​ 이 가이드는 29페이지의 설정 지침, 양식 작성, 경쟁 조사, 회의 처리, 파일 정리를 포함한 10가지 단계별 프로덕션 워크플로우, 그리고 완전한 자율 위임이 아닌 빈번한 체크포인트를 통한 반복적 협업을 통해 Claude에게 작업을 위임하는 프레임워크를 제공한다.natesnewsletter.substack​ Anthropic의 내부 연구에 따르면 사용자들은 Claude로 업무의 60%를 완료하고 50%의 생산성 향상을 달성하며, Claude Code는 2025년 5월 공개 출시 후 단 6개월 만에 연간 10억 달러의 수익을 달성했다.venturebeat+1​ https://natesnewsletter.substack.com/p/the-complete-wait-i-can-use-claude https://venturebeat.com/ai/anthropics-claude-code-can-now-read-your-slack-messages-and-write-code-for https://simonwillison.net/2025/Oct/20/claude-code-for-web/ https://x.com/DanielMiessler/status/2002485123040817525 https://www.gend.co/blog/automate-code-sessions-with-claude-in-slack https://en.wikipedia.org/wiki/Claude_(language_model) https://code.claude.com/docs/en/slack https://techcrunch.com/2025/10/20/anthropic-brings-claude-code-to-the-web/ https://x.com/mattyglesias/status/2002388080460812420 https://www.codegpt.co/blog/anthropic-claude-models-complete-guide https://x.com/simonw/status/2002416381980213307 https://www.salesforce.com/news/stories/claude-code-in-slack/ https://www.datastudios.org/post/all-claude-ai-models-available-in-2025-full-list-for-web-app-api-and-cloud-platforms https://bsky.app/profile/mattyglesias.bsky.social https://www.reddit.com/r/ClaudeCode/comments/1phuzfs/claude_code_in_slack_signals_shift_to/ https://www.anthropic.com/claude/sonnet https://x.com/LBacaj/status/2002446302744097050 https://n8n.io/integrations/claude/and/slack/ https://support.claude.com/en/articles/12138966-release-notes https://www.slowboring.com/p/mailbag-more-philosophical-than-usual https://vertu.com/lifestyle/the-ai-model-race-reaches-singularity-speed/ https://claude-plugins.dev/skills/@greyhaven-ai/claude-code-config/browser-automation https://claude-plugins.dev/skills/@chriscarterux/chris-claude-stack/effective-delegation-patterns https://newsroom.accenture.com/news/2025/accenture-and-anthropic-launch-multi-year-partnership-to-drive-enterprise-ai-innovation-and-value-across-industries https://www.datacamp.com/tutorial/claude-for-chrome-ai-powered-browser-assistance-automation https://claude-plugins.dev/skills/@rsmdt/the-startup/agent-delegation https://www.youtube.com/watch?v=4ue4CNt8YxE https://code.claude.com/docs/en/chrome https://www.youtube.com/watch?v=0J2_YGuNrDo https://www.anthropic.com/news https://github.com/SawyerHood/dev-browser https://www.youtube.com/watch?v=oZF6TgxB5yw https://www.snowflake.com/en/news/press-releases/snowflake-and-anthropic-announce-200-million-partnership-to-bring-agentic-ai-to-global-enterprises/ https://www.reddit.com/r/ClaudeAI/comments/1prcypb/anthropic_just_dropped_claude_for_chrome_ai_that/ https://claude.ai/public/artifacts/7029f156-12d7-4680-9df4-5af4715e0612 https://www.anthropic.com/news/snowflake-anthropic-expanded-partnership https://www.youtube.com/watch?v=XYzs8JJAL24 https://www.reddit.com/r/ClaudeAI/comments/1obq6wq/understanding_claude_skills_vs_subagents_its_not/ https://techcrunch.com/2025/12/04/anthropic-signs-200m-deal-to-bring-its-llms-to-snowflakes-customers/ https://www.anthropic.com/engineering/claude-code-best-practices
414 조회
0 추천
2025.12.26 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입