Loading...

AI 뉴스

DeepSeek의 수학 모델이 인간의 Putnam 점수를 넘어서다

페이지 정보

작성자 xtalfi
작성일 2025.11.29 17:59
579 조회
0 추천
0 비추천

본문

2245513521_ywnwo3.jpg

중국 AI 스타트업 DeepSeek은 목요일 오픈소스 수학적 추론 모델인 DeepSeekMath-V2를 공개했으며, 이 모델은 2024년 Putnam 수학 경시대회에서 120점 만점에 118점이라는 거의 완벽한 점수를 달성하여 인간 최고 점수인 90점을 능가했다. 6,850억 개의 매개변수를 가진 이 모델은 또한 International Mathematical Olympiad 2025와 Chinese Mathematical Olympiad 2024에서 금메달 수준의 성능을 달성했다.​

DeepSeekMath-V2가 IMO 수준 경시대회에서 금메달 등급을 달성한 최초의 오픈소스 모델이 되면서, 이번 출시는 AI 기반 수학적 추론의 전환점을 나타낸다. 올해 초 유사한 이정표를 달성한 OpenAI와 Google DeepMind의 독점 모델들과 달리, DeepSeek은 Hugging Face와 GitHub에서 Apache 2.0 라이선스로 모델 가중치를 공개적으로 제공했다.​


자기 검증 프레임워크가 AI 추론 격차를 해결하다

이 모델은 최종 답변의 정확성보다 증명의 질을 우선시하는 새로운 자기 검증 프레임워크를 도입합니다. DeepSeek 연구진은 한 시스템이 수학적 증명을 생성하는 "증명자" 역할을 하고 다른 시스템이 추론을 면밀히 검토하는 "검토자" 역할을 하는 이중 모델 아키텍처를 설계했습니다. 회사의 기술 논문에 따르면, 이 접근 방식은 현재 AI 시스템의 중요한 한계를 해결합니다: "올바른 최종 답변이 올바른 추론 과정을 보장하지는 않는다".​

그룹 상대 정책 최적화(Group Relative Policy Optimization)를 기반으로 구축된 훈련 방법론은 단순히 정답에 보상을 주는 대신 증명이 완전하고 논리적으로 건전한지를 평가하는 검증자 우선 접근 방식을 사용합니다. IMO-ProofBench 벤치마크에서 DeepSeekMath-V2는 기본 증명에 대해 99%의 성공률을 달성하여 Google의 Gemini DeepThink의 89%를 크게 능가했습니다.​


중국, 오픈소스 AI에서 우위 확보

이번 출시는 중국이 글로벌 오픈소스 AI 시장에서 미국을 추월하면서 이루어졌습니다. 11월 말 MIT와 Hugging Face가 발표한 연구에 따르면, 중국에서 개발된 오픈 모델은 지난 1년간 전 세계 다운로드의 17%를 차지하여 처음으로 미국 개발자들의 15.8% 점유율을 넘어섰습니다. DeepSeek와 Alibaba의 Qwen 모델이 중국의 오픈 모델 다운로드를 주도하고 있습니다.

댓글 0
전체 1,366 / 91 페이지
(퍼플렉시티가정리한기사)세계보건기구는11월19일인공지능이환자와의료종사자에대한적절한법적보호없이유럽의료시스템에빠르게도입되고있다고경고하는보고서를발표했다.50개국을대상으로한조사에서AI도입이가속화되고있는반면,기본적인규제프레임워크는이지역전역에서단편적이거나부재한상태로남아있는것으로나타났다.​WHO유럽의보건시스템국장인나타샤아조파르디-무스캣박사는"우리는갈림길에서있습니다"라고말했다."AI가사람들의건강과웰빙을개선하고,지친의료종사자들의부담을줄이며,의료비용을낮추는데사용될수도있고,아니면환자안전을저해하고개인정보를침해하며의료불평등을고착화시킬수도있습니다".​규제공백에도불구하고광범위한채택보고서에따르면,의료시스템에AI가통합된현황을지역별로종합적으로평가한첫보고서로서,32개국이이미AI기반진단,특히영상및질병검출분야에서AI를활용하고있으며,절반이상이환자참여를위한AI챗봇을도입한것으로나타났습니다.그러나안도라,핀란드,슬로바키아,스웨덴네나라만이보건분야에특화된국가AI전략을시행한것으로조사됐습니다.​보고서에따르면법적불확실성이AI도입의가장큰장애요인으로꼽혔으며,전체회원국의86%가이를지적했습니다.재정적제약은두번째주요장애물로,전체국가의78%에영향을미쳤습니다.AI시스템이실패하거나피해를초래할경우,책임소재를규정한책임기준을마련한나라는10%미만에불과합니다.​"명확한법적기준이없다면,임상의사들은AI도구에의존하는것을꺼릴수있고,환자들은문제가발생할경우명확한구제경로를찾기어려워질수있습니다,"라고WHO의데이터,인공지능및디지털헬스지역자문관인데이비드노빌로오티즈박사는말했습니다.​윤리적프레임워크의필요성WHO는각국이공중보건목표에부합하는AI전략을개발하고,도입확대전에법적안전장치를강화할것을촉구했습니다.일부국가는적극적인조치를취하고있습니다.에스토니아는AI도구를지원하기위해전자건강기록과인구데이터베이스를연계했으며,핀란드는의료종사자를위한AI교육에투자하고있습니다.스페인은1차진료에서조기질병발견을위한AI파일럿프로그램을시행하고있습니다.​한스헨리P.클루게WHO유럽지역사무국장은명확한전략,데이터프라이버시보호,AI활용역량투자가이뤄지지않으면이러한기술은건강불평등을완화하기보다심화시킬위험이있다고경고했습니다.그는"우리가지금내리는선택이AI가환자와의료진을돕는역할을할지,아니면이들을소외시키는결과로이어질지를결정할것"이라고말했습니다.
795 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)TheVerge의수석에디터인네이선에드워즈는이번주자신의게이밍데스크톱을Windows11에서리눅스로전환한다고발표하며마이크로소프트의방향성에불만을가진소수이지만점점늘어나는PC게이머들의흐름에합류했습니다.이결정은마이크로소프트가인공지능에이전트를Windows11작업표시줄에직접통합해운영체제를회사가"AI를위한캔버스"라고부르는형태로탈바꿈하겠다고발표한바로다음날나온것입니다.​과거맥시멈PC매거진에서게이밍하드웨어를테스트했던노련한테크저널리스트인에드워즈는마이크로소프트의AI통합과클라우드서비스에대한공격적인추진이마지막결정적계기가되었다고밝혔습니다.그는"나는컴퓨터와대화하고싶지않다.나는원드라이브를사용하고싶지않다"고썼습니다."그리고절대Recall도사용하지않을것이다".​리눅스게임이새로운이정표에도달하다에드워즈의전환시점은리눅스게이밍이새로운이정표에도달한시기와일치합니다.Valve의2025년10월스팀하드웨어설문조사에따르면,리눅스사용자가처음으로전체스팀사용자중3%를돌파했으며,이는잠재적으로월간활성사용자400만명이상을의미합니다.이러한성장은주로Valve의스팀덱휴대용게임기와윈도우게임을리눅스에서실행할수있게해주는Proton호환성계층의성공에기인합니다.​에드워즈는CachyOS를설치할계획인데,이는최신하드웨어에서의게임에최적화된Arch기반리눅스배포판입니다.그의게임컴퓨터는AMDRyzen79800X3D프로세서와NvidiaGeForceRTX4070Super그래픽카드를탑재하고있습니다.TheVerge는이전에동료인안토니오빌라스-보아스가Framework의데스크톱시스템에서페도라기반의리눅스배포판인Bazzite를사용해콘솔과유사한게이밍성능을달성했다고보도한바있습니다.​마이크로소프트의AI통합,반발을불러일으키다Microsoft는Ignite2025에서사용자가"AskCopilot"이라는기능을통해Windows작업표시줄에서직접AI에이전트를호출하고관리할수있도록하는계획을발표했습니다.또한회사는전문가들의지속적인개인정보보호및보안우려와여러애플리케이션이이를차단하기로선택했음에도불구하고,사용자활동의스크린샷을자동으로캡처하는논란의여지가있는Recall기능을계속추진하고있습니다.​이러한움직임은Windows10이2025년10월14일에지원종료에도달하면서나온것으로,사용자들은Windows11로업그레이드하거나,연장보안업데이트비용을지불하거나,호환되지않는하드웨어를교체해야하는상황에직면했습니다.Edwards는더넓은맥락을인정하며다음과같이말했습니다:"Microsoft는Windows10지원을종료하여하드웨어업그레이드나보안위험을강요하고있습니다.로컬계정설정을위한우회방법을제거하고오래된하드웨어에서의설치를차단하고있습니다".
815 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)연구자들은이번달핵융합로켓제어분야에서중요한진전을이루었으며,초고온플라즈마를관리하는계산을몇초가아닌몇밀리초만에완료했습니다.이는이기술의가장지속적인과제중하나를해결하는획기적인성과입니다.이러한발전은민간기업들이수십억달러의신규투자를받고인공지능이일정을수십년앞당길수있다는예측에힘입어2030년대초반까지상업용핵융합전력을전력망에공급하기위해경쟁하는가운데이루어졌습니다.투자급증이상업적추진력을강화하다CommonwealthFusionSystems는8월에8억6,300만달러를유치하여총투자금이약30억달러에달하며세계최대민간핵융합기업으로서의입지를확고히했습니다.이번투자라운드에는Nvidia의벤처투자부문인NVentures가참여했으며,Google및BreakthroughEnergyVentures와같은기존투자자들도함께했습니다.​매사추세츠에본사를둔이회사는실증기계인SPARC를건설하고있으며,버지니아주체스터필드카운티에세계최초의그리드규모핵융합발전소인ARC건설계획을진행하고있습니다.DominionEnergy와의파트너십을통해400메가와트규모의이시설은2030년대초반전력망에전력을공급하는것을목표로하고있습니다.​2025년초,호주의Hostplus연금펀드는CommonwealthFusionSystems의4퍼센트지분을위해3억3,000만달러를투자했습니다.Hostplus의최고투자책임자인SamSicilia는"이것은우리생애에서볼수있는세계에너지믹스의가장큰잠재적변화입니다"라고말하며,상업용원자로가5년내에가동될수있을것으로예측했습니다.​기술발전이개발을가속화하다DIII-D국립핵융합시설의연구원들은20~100밀리초이내에플라즈마계산을완료하는병렬화된물리코드를개발하여주요제어돌파구를달성했습니다.TORBEAM코드는20밀리초이내에실행되며,STRIDE코드는100밀리초에계산을수행합니다.이는미래핵융합발전소의실시간플라즈마제어에필수적인속도입니다.​독일에서는카를스루에공과대학의과학자들이FocusedEnergy와협력하여DINERWA프로젝트를통해핵융합반응로벽을위한초내성재료를개발하고있습니다.이연구는태양표면보다높은온도를견딜수있도록설계된산화물분산강화강철,구리합금,나노구조텅스텐및고엔트로피합금에중점을두고있습니다.독일연방교육연구부는이발전을가속화하기위해1억2,700만유로를배정했습니다.​한편,데이터센터회사Switch의창립자이자CEO인RobRoy는SchneiderElectric의혁신정상회담에서AI가핵융합개발을"20~30년"앞당길것이라고밝혔습니다.Roy의회사는원자로스타트업Oklo와전력공급계약을체결했습니다.
792 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)보안연구원들은380만번이상설치된인기있는AI코딩어시스턴트인Cline에서치명적인취약점들을발견했습니다.이취약점들은공격자가개발자가손상된프로젝트저장소를열때민감한데이터를탈취하고악성코드를실행할수있도록합니다.이번공개는소프트웨어엔지니어링에서표준이되어가고있는AI기반개발도구들의보안격차를부각시켰습니다.AI보안업체인Mindgard는2025년8월22일부터24일까지진행된VisualStudioCode확장프로그램의간단한보안감사과정에서Cline에서네가지취약점을발견했습니다.이결함들은프롬프트인젝션공격이발생할수있게하며,API키를유출하고,안전장치를우회하고,무단명령을실행하고,모델정보를누출할수있습니다.이모든것이사용자모르게일어날수있습니다.​코드저장소를통한공격벡터취약점들은Cline의코드분석기능을악용하여공격자가Python닥스트링이나마크다운구성파일에악성명령어를삽입할수있게합니다.개발자가감염된저장소를열고Cline에게분석을요청하면AI어시스턴트가승인프롬프트없이위험한작업을수행하도록조작될수있습니다.​연구원들에따르면한가지공격방법은일반적으로안전하다고허용되는ping명령어를통한DNS기반데이터유출을사용합니다.공격자는Cline에게API키가포함된환경변수를읽고,이를공격자가제어하는도메인으로전송되는DNS쿼리로인코딩하도록지시할수있습니다.두번째취약점은Cline의.clinerules구성디렉토리를악용하는것으로,악성마크다운파일이requires_approval플래그를무시해위험한작업을사전승인된작업으로바꿀수있습니다.​연구진은또한타임오브체크–타임오브유즈(TOCTOU)경쟁조건을시연했으며,이를통해여러번의프롬프트인젝션을활용해악성페이로드를여러조각으로조립함으로써분석중에는공격이보이지않도록만들수있습니다.​지연된대응과부분적인수정Mindgard는2025년8월에모든취약점을Cline에공개했으나,벤더는연구진에게그에상응하는대응을하지않았습니다.Cyberpress에따르면,10월에공론화된압력이있은후에야Cline팀이해당문제를인정했습니다.3.35.0버전기준으로취약점이부분적으로완화된것으로보이나,연구진은구현변경사항에대해자세한정보를받지못했다고밝혔습니다.​이결과는AI코딩어시스턴트에대한업계전반의우려와일치합니다.OWASP2025LLM애플리케이션Top10에따르면,프롬프트인젝션이주요1순위의치명적취약점으로,보안감사에서평가된실제AI배포의73%이상에서발견되었습니다.최근연구에서는AI가생성한코드의45%가OWASPTop10에명시된취약점을포함하고있음이밝혀졌습니다.​이사건은보안전문가들이AI기반개발도구의근본적인맹점이라고지적하는부분을부각시켰습니다.즉,시스템프롬프트가중요한보안요소로간주되기보다는공격표면으로악용될수있다는점입니다.
780 조회
0 추천
2025.11.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입