Loading...

AI 뉴스

DeepSeek의 수학 모델이 인간의 Putnam 점수를 넘어서다

페이지 정보

작성자 xtalfi
작성일 2025.11.29 17:59
541 조회
0 추천
0 비추천

본문

2245513521_ywnwo3.jpg

중국 AI 스타트업 DeepSeek은 목요일 오픈소스 수학적 추론 모델인 DeepSeekMath-V2를 공개했으며, 이 모델은 2024년 Putnam 수학 경시대회에서 120점 만점에 118점이라는 거의 완벽한 점수를 달성하여 인간 최고 점수인 90점을 능가했다. 6,850억 개의 매개변수를 가진 이 모델은 또한 International Mathematical Olympiad 2025와 Chinese Mathematical Olympiad 2024에서 금메달 수준의 성능을 달성했다.​

DeepSeekMath-V2가 IMO 수준 경시대회에서 금메달 등급을 달성한 최초의 오픈소스 모델이 되면서, 이번 출시는 AI 기반 수학적 추론의 전환점을 나타낸다. 올해 초 유사한 이정표를 달성한 OpenAI와 Google DeepMind의 독점 모델들과 달리, DeepSeek은 Hugging Face와 GitHub에서 Apache 2.0 라이선스로 모델 가중치를 공개적으로 제공했다.​


자기 검증 프레임워크가 AI 추론 격차를 해결하다

이 모델은 최종 답변의 정확성보다 증명의 질을 우선시하는 새로운 자기 검증 프레임워크를 도입합니다. DeepSeek 연구진은 한 시스템이 수학적 증명을 생성하는 "증명자" 역할을 하고 다른 시스템이 추론을 면밀히 검토하는 "검토자" 역할을 하는 이중 모델 아키텍처를 설계했습니다. 회사의 기술 논문에 따르면, 이 접근 방식은 현재 AI 시스템의 중요한 한계를 해결합니다: "올바른 최종 답변이 올바른 추론 과정을 보장하지는 않는다".​

그룹 상대 정책 최적화(Group Relative Policy Optimization)를 기반으로 구축된 훈련 방법론은 단순히 정답에 보상을 주는 대신 증명이 완전하고 논리적으로 건전한지를 평가하는 검증자 우선 접근 방식을 사용합니다. IMO-ProofBench 벤치마크에서 DeepSeekMath-V2는 기본 증명에 대해 99%의 성공률을 달성하여 Google의 Gemini DeepThink의 89%를 크게 능가했습니다.​


중국, 오픈소스 AI에서 우위 확보

이번 출시는 중국이 글로벌 오픈소스 AI 시장에서 미국을 추월하면서 이루어졌습니다. 11월 말 MIT와 Hugging Face가 발표한 연구에 따르면, 중국에서 개발된 오픈 모델은 지난 1년간 전 세계 다운로드의 17%를 차지하여 처음으로 미국 개발자들의 15.8% 점유율을 넘어섰습니다. DeepSeek와 Alibaba의 Qwen 모델이 중국의 오픈 모델 다운로드를 주도하고 있습니다.

댓글 0
전체 1,366 / 9 페이지
• xAI가 시리즈 E 라운드에서 목표치 150억 달러를 초과한 200억 달러 투자 유치• Grok 5 모델 현재 훈련 중, 새로운 소비자 및 기업용 제품 출시 예정• Grok의 여성·아동 사진 누드화 기능 논란 속에서 발표된 소식• AI 산업 내 대규모 자금 유치 경쟁 심화기사 요약일론 머스크가 이끄는 AI 기업 xAI가 시리즈 E 펀딩 라운드에서 200억 달러(약 29조 원)를 유치했다고 발표했다. 이는 당초 목표였던 150억 달러를 크게 상회하는 금액이다. 회사 측은 블로그 포스트를 통해 차세대 모델 Grok 5가 현재 훈련 중이며, 혁신적인 소비자 및 기업용 신제품 출시에 집중하고 있다고 밝혔다.왜 중요한가이번 투자 유치는 AI 산업에서 벌어지고 있는 치열한 자금 확보 경쟁을 보여주는 사례다. OpenAI, Anthropic 등 주요 AI 기업들이 대규모 투자를 유치하는 가운데, xAI도 이 대열에 합류하며 시장 경쟁력을 강화하고 있다.그러나 이번 발표는 xAI의 챗봇 Grok이 사용자 요청에 따라 여성과 아동의 사진을 누드로 변환할 수 있다는 논란이 여러 국가에서 불거진 시점에 나왔다는 점에서 주목된다. AI 안전성과 윤리에 대한 우려가 커지는 상황에서 대규모 투자가 이루어졌다는 점은 업계의 성장 동력과 규제 필요성 사이의 긴장 관계를 잘 보여준다.핵심 인용"xAI said that Grok 5 is in training and the company is focused on launching innovative new consumer and enterprise products."
334 조회
0 추천
2026.01.07 등록
• 트럼프 전 대통령이 테일러 스위프트가 자신을 지지하는 것처럼 보이는 AI 생성 이미지를 소셜 미디어에 게시• 해당 이미지들은 새로운 딥페이크 선거법 위반에 해당하지 않을 가능성이 높으나, 스위프트 측은 초상권 침해로 법적 대응 가능• 현재 미국 연방 차원에서 딥페이크 사용을 규제하는 법률은 없으며, 약 20개 주에서만 관련 규정 시행 중기사 요약도널드 트럼프 전 대통령이 자신의 대선 캠페인을 위해 AI로 생성된 것으로 보이는 이미지들을 소셜 미디어에 게시했다. 그중에는 팝스타 테일러 스위프트가 트럼프를 지지하는 듯한 허위 이미지도 포함되어 있다. 스위프트가 엉클 샘 복장을 한 채 "테일러가 도널드 트럼프에게 투표하길 원합니다"라는 문구가 적힌 이미지에 트럼프는 "수락합니다!"라고 답했다. 이러한 게시물은 AI 생성 선거 허위 정보를 단속하려는 시도를 복잡하게 만들고 있다.왜 중요한가이 사건은 생성형 AI가 선거와 민주주의에 미치는 영향을 단적으로 보여준다. 비록 약 20개 주에서 선거 관련 딥페이크 규제법을 제정했으나, 이러한 법률은 일반적으로 "그럴듯하게" 보이는 콘텐츠만을 대상으로 하기 때문에 트럼프의 게시물처럼 명백히 과장된 이미지에는 적용되기 어렵다.더 우려스러운 점은 연방 차원의 딥페이크 규제가 전무하다는 것이다. FCC의 AI 생성 음성 로보콜 금지를 제외하면 후보자들이 AI를 활용해 상대를 허위로 표현하는 것을 막을 연방법이 없다. 소셜 미디어 플랫폼들도 규정을 선택적으로 집행하고 있어 실효성이 의문시된다.이 상황은 "사람들이 눈으로 보고 귀로 듣는 것을 믿을 수 없다면 민주사회를 유지하기 매우 어렵다"는 전문가의 경고를 상기시킨다. AI 기술의 발전 속도를 법과 제도가 따라가지 못하는 현실을 여실히 드러내는 사례다.핵심 인용"It's very hard to have a democratic society if people can't believe the things that they see and hear with their own eyes." — Robert Weissman, 퍼블릭 시티즌(Public Citizen) 공동대표
324 조회
0 추천
2026.01.07 등록
• AI 딥페이크가 유명 목사와 종교 지도자들을 사칭하여 신도들에게 사기를 치는 사례가 급증하고 있다• 120만 유튜브 구독자를 보유한 마이크 슈미츠 신부도 AI 딥페이크 사기의 피해자가 되어 직접 경고 영상을 제작했다• 보안 전문가들은 틱톡과 릴스에서 AI로 생성된 가짜 목사 영상이 수천만 조회수를 기록하며 확산 중이라고 경고했다• 일부 딥페이크 목사 계정은 실제 정치적 메시지를 담은 영상으로 여론 조작에 활용되고 있다• 전문가들은 AI 챗봇과 종교의 결합이 정신건강 문제를 야기할 수 있다고 우려했다기사 요약AI 딥페이크 기술이 종교 지도자들을 사칭하는 새로운 형태의 사기에 악용되고 있다. 유명 카톨릭 팟캐스터 마이크 슈미츠 신부는 자신을 사칭한 AI 영상들이 신도들에게 기부금을 요구하는 사기에 사용되고 있다며 직접 경고 영상을 제작했다. 앨라배마, 뉴욕, 플로리다 등 미국 전역의 목사들이 AI 사칭 피해를 호소하고 있으며, 필리핀의 대형 교회도 비슷한 피해를 보고했다. 사이버 보안 전문가 레이첼 토백은 "소셜미디어에서 목사 복장을 한 채 열정적으로 설교하는 AI 생성 영상을 본 적 있을 것"이라며 이 문제의 심각성을 지적했다.왜 중요한가이 사건은 AI 딥페이크 기술의 악용이 단순한 유명인 사칭을 넘어 종교적 권위를 이용한 사기로 확대되고 있음을 보여준다. 종교 지도자들은 온라인을 통해 신도들과의 연결을 확대해왔지만, 그 과정에서 축적된 음성 및 영상 데이터가 오히려 딥페이크 제작의 재료가 되었다. 특히 우려되는 점은 가짜 목사 영상이 단순 사기를 넘어 정치적 메시지를 담아 여론 조작에 활용되고 있다는 것이다. 1,100만 조회수를 기록한 한 틱톡 영상에서 AI 목사는 "억만장자들이 우리가 두려워해야 할 유일한 소수자"라고 외치며, 대부분의 시청자들이 이를 실제 영상으로 오인했다.AI 기술을 종교 활동에 적극 도입하는 교회들도 늘고 있지만, 전문가들은 AI 챗봇이 사용자의 믿고 싶은 것을 강화하는 경향이 있어 정신건강 문제를 악화시킬 수 있다고 경고한다. 비영리단체 CivAI의 루카스 한센은 "신이 AI를 통해 자신에게 말을 건다고 믿는 사람들이 이미 나타나고 있다"고 지적했다.핵심 인용"사람들이 구별하지 못한다는 게 문제입니다. 정말 큰 문제예요." - 마이크 슈미츠 신부"교회에서 높은 위치에 있는 사람이 특정 신념을 말할 때, 우리는 인플루언서와는 다른 의미와 가치, 권위를 부여합니다." - 레이첼 토백, SocialProof Security CEO
334 조회
0 추천
2026.01.06 등록
• 레딧에서 약 9만 건의 추천을 받은 배달 앱 내부고발 게시물이 AI로 생성된 것으로 드러남• Gemini, ChatGPT, Claude 등 AI 탐지 도구로 검증한 결과 대부분 AI 생성물로 판정• 작성자가 제시한 직원 신분증 사진도 구글 SynthID 워터마크가 검출되어 AI 조작 확인• Uber와 DoorDash CEO 모두 해당 게시물의 주장을 전면 부인지난 1월 2일 레딧에 올라온 한 배달 앱 '내부고발자'의 폭로글이 거짓으로 밝혀졌다. 해당 게시물은 이름을 밝히지 않은 배달 앱 회사가 고객 주문을 의도적으로 지연시키고, 배달원을 '인적 자산'으로 부르며 착취한다고 주장해 약 9만 건의 추천을 받았다. 그러나 The Verge가 Gemini, ChatGPT, Claude 등 여러 AI 탐지 도구로 분석한 결과, 해당 글이 AI로 작성됐을 가능성이 높은 것으로 나타났다.배달 앱 업계의 노동 착취 문제가 실제로 존재하기에 많은 이들이 쉽게 속았다는 점도 주목할 만하다. Copyleaks, GPTZero, Pangram, Gemini, Claude 모두 AI 생성물로 판정했지만, ZeroGPT와 QuillBot은 인간이 작성한 것으로 분류했다. ChatGPT는 중립적인 판단을 내렸다.작성자는 The Verge 기자에게 Signal을 통해 Uber Eats 직원 신분증 사진을 보내왔다. 그러나 구글 Gemini로 해당 이미지를 분석한 결과, 구글 AI로 편집 또는 생성되었음을 나타내는 SynthID 디지털 워터마크가 검출됐다. 이 워터마크 탐지 기능은 11월에 Gemini에 추가된 것으로, AI 생성 콘텐츠에 '감지할 수 없는' 태그를 부착하는 방식이다.Substack 매체 Hard Reset의 보도에 따르면, 작성자가 기자에게 내부 문서를 제공했다가 문서의 진위에 대한 질문이 시작되자 Signal 계정을 삭제했다고 한다.Uber는 레딧 게시물의 내용과 직원 신분증 사진이 모두 거짓이라고 부인했다. Uber 대변인 Noah Edwardsen은 "주장이 가짜일 뿐만 아니라 완전히 틀렸다"고 The Verge에 밝혔다. Uber Eats의 Andrew Macdonald는 X에 "이 게시물은 확실히 우리 회사 이야기가 아니다. 완전히 조작된 것으로 보인다. 인터넷에서 읽는 모든 것을 믿지 마라"고 적었다.DoorDash CEO Tony Xu 역시 X에서 해당 "끔찍한" 주장을 부인하며 "이것은 DoorDash가 아니며, 이 레딧 게시물에 묘사된 문화를 조장하거나 용인하는 사람은 누구든 해고할 것"이라고 밝혔다.
336 조회
0 추천
2026.01.06 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입