Loading...

AI 뉴스

DeepSeek의 수학 모델이 인간의 Putnam 점수를 넘어서다

페이지 정보

작성자 xtalfi
작성일 2025.11.29 17:59
1,023 조회
0 추천
0 비추천

본문

2245513521_ywnwo3.jpg

중국 AI 스타트업 DeepSeek은 목요일 오픈소스 수학적 추론 모델인 DeepSeekMath-V2를 공개했으며, 이 모델은 2024년 Putnam 수학 경시대회에서 120점 만점에 118점이라는 거의 완벽한 점수를 달성하여 인간 최고 점수인 90점을 능가했다. 6,850억 개의 매개변수를 가진 이 모델은 또한 International Mathematical Olympiad 2025와 Chinese Mathematical Olympiad 2024에서 금메달 수준의 성능을 달성했다.​

DeepSeekMath-V2가 IMO 수준 경시대회에서 금메달 등급을 달성한 최초의 오픈소스 모델이 되면서, 이번 출시는 AI 기반 수학적 추론의 전환점을 나타낸다. 올해 초 유사한 이정표를 달성한 OpenAI와 Google DeepMind의 독점 모델들과 달리, DeepSeek은 Hugging Face와 GitHub에서 Apache 2.0 라이선스로 모델 가중치를 공개적으로 제공했다.​


자기 검증 프레임워크가 AI 추론 격차를 해결하다

이 모델은 최종 답변의 정확성보다 증명의 질을 우선시하는 새로운 자기 검증 프레임워크를 도입합니다. DeepSeek 연구진은 한 시스템이 수학적 증명을 생성하는 "증명자" 역할을 하고 다른 시스템이 추론을 면밀히 검토하는 "검토자" 역할을 하는 이중 모델 아키텍처를 설계했습니다. 회사의 기술 논문에 따르면, 이 접근 방식은 현재 AI 시스템의 중요한 한계를 해결합니다: "올바른 최종 답변이 올바른 추론 과정을 보장하지는 않는다".​

그룹 상대 정책 최적화(Group Relative Policy Optimization)를 기반으로 구축된 훈련 방법론은 단순히 정답에 보상을 주는 대신 증명이 완전하고 논리적으로 건전한지를 평가하는 검증자 우선 접근 방식을 사용합니다. IMO-ProofBench 벤치마크에서 DeepSeekMath-V2는 기본 증명에 대해 99%의 성공률을 달성하여 Google의 Gemini DeepThink의 89%를 크게 능가했습니다.​


중국, 오픈소스 AI에서 우위 확보

이번 출시는 중국이 글로벌 오픈소스 AI 시장에서 미국을 추월하면서 이루어졌습니다. 11월 말 MIT와 Hugging Face가 발표한 연구에 따르면, 중국에서 개발된 오픈 모델은 지난 1년간 전 세계 다운로드의 17%를 차지하여 처음으로 미국 개발자들의 15.8% 점유율을 넘어섰습니다. DeepSeek와 Alibaba의 Qwen 모델이 중국의 오픈 모델 다운로드를 주도하고 있습니다.

댓글 0
전체 1,366 / 177 페이지
(퍼플렉시티가정리한기사)Google은화요일에GoogleMaps를위한AI기반실시간차선안내기능의출시를발표했으며,이는내비게이션서비스가인간운전자처럼도로를"볼수있는"최초의사례입니다.이획기적인기능은앞으로몇달에걸쳐미국과스웨덴에서Polestar4전기자동차에독점적으로출시됩니다.​이기술은차량의전방카메라를인공지능과결합하여차선표시와도로표지판을실시간으로분석한다음,이시각데이터를GoogleMaps의내비게이션시스템과통합하여맞춤형음성및시각적안내를제공합니다.운전자가다가오는출구를위한잘못된차선에있을때,시스템은자동으로그들의위치를감지하고안전하게차선을변경하도록안내합니다.​실시간컴퓨터비전과내비게이션의만남위성위치확인과사전매핑된데이터에만의존하는기존GPS시스템과달리,실시간차선안내는도로상황의실시간시각적분석으로의근본적인전환을나타냅니다.AI는카메라피드에나타나는차선표시와도로인프라를처리한다음,이정보를내비게이션요구사항과즉시연관시킵니다.​구글은공식블로그게시물에서"따라서왼쪽끝차선에있는데출구가오른쪽에있는경우,실시간차선안내가자동으로이를감지하고명확한음성및시각적신호를사용하여제때차선을변경하도록알려줍니다"라고설명했습니다.이기능은Polestar4의10.2인치운전자디스플레이에나타나며,파란색하이라이트로최적의차선을표시하고화살표아이콘으로차량의현재위치를나타냅니다.​Polestar의UX/UI책임자인SidOdedra는이기능이"Polestar의운전자중심UX전략의방향을이어가며,놓친출구와막판차선변경에대한걱정을크게줄여운전자의스트레스를감소시키고안전성을향상시킵니다"라고말했습니다.​전략적파트너십으로내비게이션역량확대이번출시는2020년Polestar2가Google내장기능을탑재한최초의차량이되면서시작된Google과Polestar의5년파트너십을기반으로합니다.이협력은이전에GoogleChrome브라우저와고해상도매핑을Polestar차량에제공한바있습니다.​GoogleMaps의제품관리이사인AndrewFoster는"Polestar4는사람들이더욱자신감있게운전할수있도록돕고자동차업계전반의내비게이션에대한새로운기준을설정할획기적인실시간차선안내를통합하는최초의차량이될것"이라고언급했습니다.​Google은이기능이고속도로를넘어추가도로유형과다른자동차제조업체와의파트너십을통해더많은차량으로확장될것이라고확인했지만,구체적인일정과파트너는공개되지않았습니다.이기술은매월20억명이상의사용자에게서비스를제공하는GoogleMaps의기존인프라를활용합니다.
1687 조회
0 추천
2025.11.05 등록
(퍼플렉시티가정리한기사)OpenAI는화요일자사의바이럴AI비디오생성앱Sora를안드로이드기기에공식출시하여,이전에웹브라우저에의존하거나iOS출시를기다려야했던수백만사용자에게접근성을확대했습니다.이앱은현재7개국의GooglePlay스토어에서초대코드없이이용가능하며,이는독점적출시전략에서크게전환된것입니다.​안드로이드출시는9월Sora의iOS출시약한달후에이루어졌으며,iOS버전은5일만에100만건이상의다운로드를달성하고거의3주동안Apple의AppStore차트를장악했습니다.이앱은현재미국,캐나다,일본,한국,대만,태국,베트남에서이용가능하며,OpenAI는유럽및추가시장으로의확장계획을밝혔습니다.​새로운기능이수익화전략을주도합니다Android출시와함께OpenAI는현재의무료모델이"완전히지속불가능하다"는점을인정하며여러수익화기능을도입했습니다.사용자들은이제일일무료생성한도인일반사용자30개또는Pro구독자100개를초과하면10개비디오번들당4달러에추가비디오생성을구매할수있습니다.​OpenAI의Sora책임자인BillPeebles는X의게시물에서"우리의파워유저들이Sora를얼마나많이사용하고싶어하는지상당히놀랐으며,현재경제성은완전히지속불가능합니다"라고말했습니다.회사는GPU제약으로인해무료생성한도가시간이지남에따라감소할가능성이높다고경고했습니다.​앱은또한캐릭터카메오기능을출시하여개인딥페이크를넘어사용자가반려동물,장난감,예술작품또는가상캐릭터로부터재사용가능한아바타를생성할수있도록확장했습니다.이러한캐릭터는개별표시이름과핸들을받으며,개인사용부터커뮤니티전체이용까지맞춤형개인정보보호설정을제공합니다.​소셜기능및법적과제Sora는사용자가스크롤가능한피드를통해AI생성비디오를제작,공유및리믹스하는TikTok스타일의소셜플랫폼으로기능합니다.새로운기능에는여러클립을결합하는비디오스티칭도구와인기콘텐츠및인기캐릭터를보여주는리더보드가포함됩니다.​그러나이플랫폼은"cameo"브랜딩과관련하여법적조사를받고있으며,유명인비디오서비스인Cameo가캐릭터cameo기능이출시되기불과며칠전에OpenAI를상대로상표권침해소송을제기했습니다.이앱은또한MartinLutherKingJr.와같은역사적인물과인기프랜차이즈의저작권이있는캐릭터에대한부적절한딥페이크논란을겪었습니다.​OpenAI는크리에이터수익화옵션을도입하여권리보유자가인기캐릭터와개인이등장하는cameo에대해수수료를부과할수있도록할계획입니다.이는출시이후플랫폼을괴롭혀온저작권및초상권문제를해결하면서"AI기반크리에이터경제"라고부르는것을구축하려는회사의광범위한전략을나타냅니다.
1652 조회
0 추천
2025.11.05 등록
(퍼플렉시티가정리한기사)트럼프대통령의암호화폐및AI차르인데이비드색스는월요일인공지능이"오웰리안"적수준의정부감시를가능하게한다는강력한경고를발표했으며,AI로부터의진정한위협은기계가인간에게등을돌리는것이아니라국가의정보통제와시민감시라고주장했다.앤드리슨호로위츠의팟캐스트"TheBen&MarcShow"에서색스는가장큰위험은"당신에게거짓말을하고,답변을왜곡하며,권력을가진사람들의현재정치적의제에봉사하기위해실시간으로역사를다시쓸수있는"AI시스템에있다고강조했다.그는AI가잠재적으로"정부가당신을감시하고통제하는완벽한도구"가될수있다고설명했다.​AI규제철학을둘러싼충돌Sacks의발언은AI기업Anthropic과의진행중인공개논쟁을격화시켰으며,그는Anthropic이"공포조장에기반한정교한규제포획전략을운영하고있다"고비난했다.이논쟁은AI거버넌스에대한근본적으로다른접근방식을중심으로하며,Sacks는포괄적인개발자규제보다는AI오용을표적으로삼을것을주장하고있다.​"우리가실제로이야기하고있는것은오웰적AI입니다"라고Sacks는말하며,할리우드가묘사하는AI위협과자신의우려를구분했다."터미네이터가아니라1984입니다"라고그는조지오웰의디스토피아적감시국가를언급하며말했다.​AnthropicCEODarioAmodei가Sacks의주장에대해"부정확하다"고반박하며자신의회사가상충되는주규제를피하기위해일관되게연방감독을옹호해왔다고주장하면서갈등이심화되었다.Amodei는Anthropic의"공익헌장이사회의더큰선을위해AI를사용할것을약속한다"고강조했다.​기술산업분열이나타나다이논쟁은실리콘밸리AI커뮤니티내에서더깊은정치적분열을드러냈다.링크드인공동창업자리드호프만은앤트로픽을"착한쪽"이라고옹호했으며,이에대해색스는호프만을"트럼프대통령을상대로한법적전쟁과비열한술수의주요자금제공자"라고강하게비난했다.경쟁AI업체xAI를운영하는일론머스크도"그렇다(Indeed)"는짧은코멘트로색스의입장에동의했다.​색스는특히바이든행정부의정책과캘리포니아및콜로라도와같은민주당주도의주들이"알고리즘차별"을다루기위해시행한"과도한"AI소비자보호법률을비판했다.그는과도한규제가AI를정부의편향을반영하는정치적도구로변질시켜불편한진실을억압할수있다고경고했다.​색스에따르면트럼프행정부의접근방식은AI분야의혁신을촉진하고암호화폐시장에규제적확실성을제공하는데중점을두고있다.이는이전행정부가AI안전과피해방지에중점을뒀던것과는큰전환점이다.
1665 조회
0 추천
2025.11.05 등록
(퍼플렉시티가정리한기사)Shopify는월요일3분기실적발표에서AI기반커머스의극적인성장을발표했으며,AI도구로부터의트래픽이1월이후7배증가했고AI기반검색을통한주문이같은기간동안11배증가했다고밝혔습니다.이전자상거래대기업은전년대비32%증가한28억4천만달러의매출을기록하면서이러한수치를보고했지만,영업이익기대치를소폭하회하여주가는장전거래에서3%하락했습니다.​AI파트너십이새로운커머스채널을주도하다HarleyFinkelstein사장은실적발표에서인공지능을"인터넷이후기술의가장큰변화"로규정하며,ChatGPT,Perplexity,MicrosoftCopilot과의통합을회사가"에이전틱커머스(agenticcommerce)"라고부르는것의핵심동력으로강조했습니다.이새로운모델은AI에이전트가대화형인터페이스내에서구매자를대신하여검색하고,비교하고,구매를촉진할수있게합니다.​회사의9월OpenAI와의파트너십을통해미국ChatGPT사용자들은채팅대화내에서Etsy판매자로부터직접구매할수있게되었으며,곧백만명이상의Shopify판매자들도유사한접근권한을얻을예정입니다.Finkelstein은"우리는모든AI대화에쇼핑을도입하는것을정말쉽게만들기위해이인프라를구축하고투자해왔습니다"라고말했습니다.최근Shopify설문조사에따르면소비자의64%가홀리데이쇼핑중어떤형태로든AI를사용할것으로예상하고있습니다.​내부AI도구가가능성을보이다외부파트너십외에도,Shopify의내부AI어시스턴트Sidekick은출시이후거의1억건의판매자상호작용을생성했으며,10월에만800만건을기록했습니다.3분기동안75만명이상의판매자가이도구를처음사용했습니다.또한회사는직원들이판매자피드백과지원티켓을분석하여제품개발결정을가속화하는데도움을주는AI도구인Scout를배포하고있습니다.​AI급증은Shopify의총상품거래액이전년대비32%증가한920억달러를기록하는가운데나타났으며,회사는4분기에20%중후반대의매출성장을전망하고있습니다.강력한펀더멘털에도불구하고,분석가들은AI개발투자와마케팅지출증가로인해영업비용이25.5%증가했다고지적했습니다.
1985 조회
0 추천
2025.11.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입