AI 뉴스

딥씨크, R1 훈련 비용이 단 29만 4천 달러였음을 공개

페이지 정보

작성자 xtalfi
작성일 2025.09.18 02:46
3,137 조회
0 추천
0 비추천

본문

54383fe11e56d17fceb44cc59728749cwg0Z.png

(퍼플렉시티가 정리한 기사)

중국 AI 스타트업 DeepSeek은 획기적인 R1 모델 훈련 방식에 관한 새로운 세부 정보를 세계적인 권위지 네이처(Nature)의 동료검토 논문을 통해 발표했습니다. 이 논문에서는 기존 경쟁 모델 대비 극히 적은 비용으로 순수 강화학습만을 사용해 첨단 추론 능력을 달성한 방법을 공개했습니다.


항저우에 본사를 둔 이 회사는 자사의 R1 추론 모델 훈련 비용이 단 29만 4천 달러에 불과하며, 기반 베이스 모델의 개발 비용은 약 600만 달러였음을 처음으로 공개했습니다. 총 630만 달러가 소요된 것으로, 이는 미국의 기술 기업들이 개발한 경쟁 모델이 수천만 달러에 달하는 것과는 극명한 대조를 이룹니다.


순수 강화학습의 획기적인 발전


DeepSeek의 주요 혁신은 연구자들이 “순수 강화 학습(pure reinforcement learning)“이라고 부르는 방식을 사용해 R1을 개발한 점에 있으며, 이는 인간이 만든 예시에 의존하는 기존의 감독 학습(supervised learning) 방식과는 다른 접근법입니다. 이 과정에서 모델은 인간이 선택한 추론 방식에 따르도록 학습시키는 대신, 올바른 답변에 도달할 때 보상을 받도록 설계되었습니다.


네이처(Nature) 논문에 따르면, DeepSeek의 접근법은 모델이 인간이 제시한 전략을 따르지 않고도 자체적인 추론 전략을 개발하고 자신의 작업을 검증할 수 있는 능력을 갖추게 해주었습니다. 회사는 자체 시도에 대해 별도의 알고리즘을 사용하지 않고 추정치를 활용해 점수를 매길 수 있게 해주는 Group Relative Policy Optimization(GRPO)이라는 기법을 활용했습니다.


“이 모델은 AI 연구자들 사이에서 매우 영향력이 컸습니다,“라고 오하이오 주립대(Ohio State University) 콜럼버스 소재 AI 연구원인 Huan Sun은 말했습니다. “2025년 현재까지 LLM에서 강화 학습을 수행하는 거의 모든 연구가 어떻게든 R1로부터 영감을 받았을지도 모릅니다”.


5단계 훈련 과정


완전한 R1 학습 과정은 감독 학습(fine-tuning)과 강화 학습을 번갈아가며 진행하는 여러 단계로 구성되었습니다. 이 과정은 딥시크(DeepSeek)의 V3-Base 모델을 수천 개의 ‘콜드 스타트’ 데이터 포인트로 파인튜닝하는 것으로 시작했고, 이후 순수 강화 학습을 통해 추론 능력을 향상시켰습니다.


수렴에 가까워지면 시스템은 리젝션 샘플링(rejection sampling) 방식을 사용했습니다. 여기서 모델은 강화 학습 실행에서 성공적인 예시 중 최상의 예시를 선택해 자체 합성 훈련 데이터를 생성했습니다. 이 합성 데이터는 이후 글쓰기나 사실 기반 질문응답 등 다양한 영역에서 DeepSeek-V3-Base의 감독 학습 데이터와 통합되었습니다.


동료 평가 중인 최초의 주요 LLM


R1은 엄격한 동료 평가 과정을 거친 최초의 대형 언어 모델을 의미합니다. Nature 논문을 심사한 허깅페이스의 머신러닝 엔지니어 루이스 턴스톨은 이를 “매우 환영할 만한 선례”라고 평가하며, 훈련 과정이 공개되지 않으면 AI 시스템이 위험을 초래하는지 평가하기 어렵다고 언급했습니다.
이 동료 평가 과정에서 DeepSeek는 훈련에 사용된 데이터 유형과 안전 조치를 포함한 기술적 세부 사항에 대한 설명을 추가하게 되었습니다. 이 모델은 오픈소스 특성을 유지하면서도 OpenAI의 o1 모델에 필적하는 추론 벤치마크 성능을 달성하였습니다.


성능 및 접근성


Hugging Face에서 1월에 출시된 이후, R1은 복잡한 문제 해결을 위한 플랫폼에서 가장 많이 다운로드된 모델이 되었으며, 다운로드 수는 1,090만 회를 넘어섰습니다. 이 모델은 AIME 2024 수학 벤치마크에서 pass@1 점수 79.8%를 기록하여 OpenAI o1의 79.2%를 소폭 앞섰습니다.


DeepSeek의 혁신은 AI 개발 비용 및 성능 향상을 위해 모델 크기와 연산 능력을 늘려야 한다는 확장 법칙에 대한 기존의 통념에 도전장을 내밀었습니다. 회사는 비교적 덜 강력한 H800 칩을 사용해 성공을 거두었으며, 이 칩은 2023년 미국의 수출 통제로 중국 내 판매가 금지된 바 있습니다. 이러한 성과는 향후 AI 개발 방향에 대한 논의를 촉진하고 있습니다.

댓글 0
전체 1,366 / 175 페이지
(퍼플렉시티가정리한기사)네이버가엔비디아GPU6만장확보와함께피지컬AI기술력을앞세워글로벌AI시장공략에나선다.최수연네이버대표는5일3분기실적발표컨퍼런스콜에서"엔비디아와업무협약을체결하고최신그래픽처리장치6만장을추가확보했다"며"피지컬AI공략을위해현재반도체,조선,방산등많은제조업파트너사와협업을논의중"이라고밝혔다.​분기최초3조원돌파,역대최대실적달성네이버는2025년3분기매출액3조1381억원,영업이익5706억원을기록해분기기준처음으로매출3조원을돌파했다고5일발표했다.매출액은전년동기대비15.6%,영업이익은8.6%증가하며역대최대실적을달성했다.AI기반광고솔루션과개인화추천서비스강화로홈피드일평균이용자수가1000만명을돌파하는등'AI접목'효과가가시화됐다.​피지컬AI선점위해GPU에1조원투자네이버는AI인프라강화를위해공격적인투자에나선다.김희철최고재무책임자는"올해GPU를포함한전체인프라투자가1조원정도로예상되며,2026년이후피지컬AI공략등신규사업확대를감안했을때GPU에만1조원이상의투자가예상된다"고말했다.최대표는"피지컬AI라는개념이나오기전인2017년부터네이버랩스를설립해피지컬AI를위한기술을선행연구해왔다"며"해당기술들이글로벌최고수준이라자부한다"고강조했다.​네이버는로봇운영체제'아크(ARC)'와정밀내비게이션소프트웨어'얼라이크(ALIKE)'등독자기술을보유하고있다고설명했다.최대표는"향후전세계로보틱스시장의약30%이상을차지할것으로조심스럽게예측한다"며글로벌시장공략에대한자신감을나타냈다.또한2026년봄쇼핑AI에이전트출시를시작으로생성형검색경험을제공하는AI탭,통합에이전트까지순차출시할계획이라고밝혔다.​네이버의GPU확보는도널드트럼프미국대통령이"엔비디아블랙웰GPU를미국외에는누구도갖지못하게하겠다"고발언한상황에서나와주목받고있다.그러나업계에서는이발언이중국을겨냥한조치로분석하며,한국에대한26만장GPU공급약속은유지될것으로전망하고있다.
1652 조회
0 추천
2025.11.05 등록
(퍼플렉시티가정리한기사)글로벌빅테크기업들이인공지능(AI)도입확산에따른구조조정으로대규모감원을잇따라발표하고있다.IBM은4일(현지시간)4분기중전세계인력의한자릿수비율에해당하는수천명을감원하겠다고발표했다.​IBM은성명에서"우리는정기적으로인력을검토해재조정한다"며"4분기에우리는전세계인력의한자릿수비율에영향을미칠조치를시행중"이라고밝혔다.지난해말기준IBM의전체직원수는27만명으로,1%만감축하더라도2700명에달하는규모다.​AI도입가속화로빅테크감원행렬아빈드크리슈나IBMCEO체제에서IBM은AI시장성장에맞춰클라우드서비스매출을높이기위해소프트웨어부문에집중하고있다.하지만지난달소프트웨어부문매출액성장이시장기대에못미치면서주가가하락세를이어가고있는상황이다.​IBM에앞서Amazon은지난달말1만4000명을해고하는대규모인력조정을단행했다.로이터통신등에따르면아마존은총3만명규모의감원을계획하고있는것으로전해진다.앤디재시아마존CEO는"생성형AI도입으로향후몇년간사무직인력규모가줄어들것"이라는사내메시지를전달하기도했다.​Meta도10월AI부문인메타슈퍼인텔리전스랩스에서600명을감원했다고발표했다.알렉산드르왕메타최고AI책임자는내부메모에서"팀규모를줄임으로써의사결정에필요한논의가줄어들고,각개인이더큰책임과영향력을가질수있다"고설명했다.​전방위적고용시장충격미국감원추적사이트'레이오프'에따르면올해들어218개테크기업에서11만2732명이일자리를잃었다.Intel은지난4월2만2000명을감원했고,Microsoft는7월에9000명을해고했다.​세계경제포럼(WEF)은올해보고서에서"고용주의41%가AI로인한인력감축을계획중"이라며"기술변화가일자리구조를재편하고있다"고분석했다.테크기업들이AI데이터센터등인프라에막대한투자를하고있는만큼,비용절감을위한인력구조조정이계속될전망이다.
1652 조회
0 추천
2025.11.05 등록
(퍼플렉시티가정리한기사)기업중심의스테이블코인결제플랫폼인Pay3는오늘AI에이전트가디지털화폐를사용하여금융거래를자율적으로실행하고최적화할수있도록설계된에이전틱결제플랫폼(AgenticPaymentsPlatform)의출시를발표했습니다.이플랫폼은인공지능시스템이비즈니스운영에점점더통합됨에따라자율적의사결정을지원하는인프라에대한증가하는수요를해결합니다.​이번발표는기업의에이전틱AI도입이급속도로가속화되는시점에나왔습니다.가트너는2028년까지기업용소프트웨어의33%가에이전틱AI기능을포함할것으로예측하며,이는2024년의1%미만에서증가한수치입니다.또한이리서치기업은2028년까지일상업무결정의최소15%가에이전틱AI를통해자율적으로이루어질것으로전망하고있습니다.​스테이블코인이AI네이티브통화로부상하다Pay3의플랫폼은스테이블코인결제,지능형라우팅,주요블록체인전반의실시간결제를통합하여AI시스템이가격책정,청구및자금흐름을동적으로관리할수있도록지원합니다.이러한접근방식은스테이블코인이AI에이전트를위한최적의결제수단이라는업계의광범위한합의를반영합니다.​Pay3의공동창업자이자CEO인PriyaKarnik은"스테이블코인은미래의금융인프라를구축하고있습니다"라고말했습니다."Pay3에서우리는에이전틱AI와스테이블코인결제라는두가지세대적기술의교차점에있으며,금융을그어느때보다더스마트하고빠르며접근가능하게만들고있습니다."​업계전문가들은은행이모든계정뒤에인간또는법인주체를요구하기때문에전통적인은행인프라는AI에이전트를고객으로수용할수없다고주장합니다.스테이블코인은AI에이전트가은행승인없이즉시온보딩하면서달러등가성을유지할수있는퍼블릭블록체인에연결된결제시스템과가치저장수단을제공함으로써이문제를해결합니다.​Google프로토콜통합계획됨Pay3는자율적인에이전트간거래를가능하게하는Google의새로운A2A(Agent-to-Agent)오픈프로토콜을활용하여기능을확장할계획입니다.올해초50개이상의기술파트너의지원을받아발표된Google의A2A프로토콜은AI에이전트가안전하게통신하고정보를교환하며기업플랫폼전반에서작업을조율할수있도록합니다.​이프로토콜은전문지갑소프트웨어없이도기계간스테이블코인결제를가능하게하는Coinbase의x402와같은기존결제표준을보완합니다.AI에이전트가페이월을만나면서명된스테이블코인결제를요청헤더에추가하고거래를진행할수있습니다.​시장모멘텀구축Pay3의출시는에이전트결제분야의광범위한모멘텀을반영합니다.PayPal은최근Mastercard의에이전트결제플랫폼과의통합을발표했으며,Mastercard는미국카드소지자들에게AgentPay토큰을제공했습니다.한편,PayOS는9월에MastercardAgenticTokens를사용하여획기적인에이전트결제거래를완료했습니다.​스테이블코인시장은총공급량이3,000억달러를초과하고월간거래량이1.25조달러에근접하며사상최고치를기록했습니다.기업채택이가속화되고있으며,설문조사에응한기업의53%가현재또는향후스테이블코인사용을보고했습니다.​Pay3는Citi,Paytm,Yahoo,Ola및BCGDigitalVentures에서풍부한경험을쌓은PriyaKarnik과RajivThondanoor가설립했습니다.이플랫폼은국경간결제,재무최적화,그리고60개이상의국가에서300개이상의결제방법을통한스테이블코인수용을포함한기업사용사례를지원합니다.
1996 조회
0 추천
2025.11.05 등록
(퍼플렉시티가정리한기사)아시아증시는수요일인공지능버블에대한우려로역내기술주에서대규모매도세가촉발되면서수개월만에가장급격한하락세를보였다.이는월스트리트의주요은행들이잠재적시장조정에대해전날밤경고한데따른것이다.한국의코스피지수는최대6%급락하며2024년8월이후가장큰단일거래일낙폭을기록했다.일본의닛케이225지수는4.5%하락하며10월말이후처음으로중요한50,000선아래로떨어졌다.홍콩의항셍지수는1.1%하락했고,대만의벤치마크지수는2.5%하락했다.​월스트리트경고로글로벌매도세촉발아시아시장의급락은화요일골드만삭스와모건스탠리의CEO들이향후12~24개월내에주식시장이10~20%의조정을받을수있다고경고한데따른것이다.골드만삭스CEO데이비드솔로몬은홍콩에서열린글로벌금융리더스투자서밋에서"향후12~24개월내에주식시장에서10~20%의하락이있을가능성이높다"고말했다.​이러한경고는AI주도랠리가밸류에이션을지속불가능한수준으로끌어올렸는지에대한투자자들의의문이제기되면서나왔다.기술주가화요일미국시장하락을주도했으며,나스닥종합지수는2%하락했고S&P500은1.2%하락했다.​기술대기업들이매도세의직격탄을맞다SoftBankGroup이가장큰피해를입으며14%이상급락하여약320억달러의시가총액이증발했습니다.이일본대기업은대규모AI투자로인해투자자들이인공지능관련주식에서이탈하면서특히취약한상태가되었습니다.​한국에서는반도체대기업삼성전자와SK하이닉스가각각약6-7%하락했으며,이는올해각각80%및200%이상급등했음에도불구하고발생한것입니다.대만반도체제조는초기거래에서3%하락했습니다.​이번매도는AI섹터의과도한밸류에이션에대한회의론이커지는것을반영했으며,특히"빅쇼트"투자자마이클버리가엔비디아와팔란티어테크놀로지스에대한대규모약세베팅을공개한이후나타났습니다.버리의사이언애셋매니지먼트는엔비디아에대해1억8,660만달러,팔란티어에대해9억1,200만달러상당의풋옵션을공개했습니다.
1661 조회
0 추천
2025.11.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입