Loading...

AI 뉴스

딥씨크, R1 훈련 비용이 단 29만 4천 달러였음을 공개

페이지 정보

작성자 xtalfi
작성일 2025.09.18 02:46
2,984 조회
0 추천
0 비추천

본문

54383fe11e56d17fceb44cc59728749cwg0Z.png

(퍼플렉시티가 정리한 기사)

중국 AI 스타트업 DeepSeek은 획기적인 R1 모델 훈련 방식에 관한 새로운 세부 정보를 세계적인 권위지 네이처(Nature)의 동료검토 논문을 통해 발표했습니다. 이 논문에서는 기존 경쟁 모델 대비 극히 적은 비용으로 순수 강화학습만을 사용해 첨단 추론 능력을 달성한 방법을 공개했습니다.


항저우에 본사를 둔 이 회사는 자사의 R1 추론 모델 훈련 비용이 단 29만 4천 달러에 불과하며, 기반 베이스 모델의 개발 비용은 약 600만 달러였음을 처음으로 공개했습니다. 총 630만 달러가 소요된 것으로, 이는 미국의 기술 기업들이 개발한 경쟁 모델이 수천만 달러에 달하는 것과는 극명한 대조를 이룹니다.


순수 강화학습의 획기적인 발전


DeepSeek의 주요 혁신은 연구자들이 “순수 강화 학습(pure reinforcement learning)“이라고 부르는 방식을 사용해 R1을 개발한 점에 있으며, 이는 인간이 만든 예시에 의존하는 기존의 감독 학습(supervised learning) 방식과는 다른 접근법입니다. 이 과정에서 모델은 인간이 선택한 추론 방식에 따르도록 학습시키는 대신, 올바른 답변에 도달할 때 보상을 받도록 설계되었습니다.


네이처(Nature) 논문에 따르면, DeepSeek의 접근법은 모델이 인간이 제시한 전략을 따르지 않고도 자체적인 추론 전략을 개발하고 자신의 작업을 검증할 수 있는 능력을 갖추게 해주었습니다. 회사는 자체 시도에 대해 별도의 알고리즘을 사용하지 않고 추정치를 활용해 점수를 매길 수 있게 해주는 Group Relative Policy Optimization(GRPO)이라는 기법을 활용했습니다.


“이 모델은 AI 연구자들 사이에서 매우 영향력이 컸습니다,“라고 오하이오 주립대(Ohio State University) 콜럼버스 소재 AI 연구원인 Huan Sun은 말했습니다. “2025년 현재까지 LLM에서 강화 학습을 수행하는 거의 모든 연구가 어떻게든 R1로부터 영감을 받았을지도 모릅니다”.


5단계 훈련 과정


완전한 R1 학습 과정은 감독 학습(fine-tuning)과 강화 학습을 번갈아가며 진행하는 여러 단계로 구성되었습니다. 이 과정은 딥시크(DeepSeek)의 V3-Base 모델을 수천 개의 ‘콜드 스타트’ 데이터 포인트로 파인튜닝하는 것으로 시작했고, 이후 순수 강화 학습을 통해 추론 능력을 향상시켰습니다.


수렴에 가까워지면 시스템은 리젝션 샘플링(rejection sampling) 방식을 사용했습니다. 여기서 모델은 강화 학습 실행에서 성공적인 예시 중 최상의 예시를 선택해 자체 합성 훈련 데이터를 생성했습니다. 이 합성 데이터는 이후 글쓰기나 사실 기반 질문응답 등 다양한 영역에서 DeepSeek-V3-Base의 감독 학습 데이터와 통합되었습니다.


동료 평가 중인 최초의 주요 LLM


R1은 엄격한 동료 평가 과정을 거친 최초의 대형 언어 모델을 의미합니다. Nature 논문을 심사한 허깅페이스의 머신러닝 엔지니어 루이스 턴스톨은 이를 “매우 환영할 만한 선례”라고 평가하며, 훈련 과정이 공개되지 않으면 AI 시스템이 위험을 초래하는지 평가하기 어렵다고 언급했습니다.
이 동료 평가 과정에서 DeepSeek는 훈련에 사용된 데이터 유형과 안전 조치를 포함한 기술적 세부 사항에 대한 설명을 추가하게 되었습니다. 이 모델은 오픈소스 특성을 유지하면서도 OpenAI의 o1 모델에 필적하는 추론 벤치마크 성능을 달성하였습니다.


성능 및 접근성


Hugging Face에서 1월에 출시된 이후, R1은 복잡한 문제 해결을 위한 플랫폼에서 가장 많이 다운로드된 모델이 되었으며, 다운로드 수는 1,090만 회를 넘어섰습니다. 이 모델은 AIME 2024 수학 벤치마크에서 pass@1 점수 79.8%를 기록하여 OpenAI o1의 79.2%를 소폭 앞섰습니다.


DeepSeek의 혁신은 AI 개발 비용 및 성능 향상을 위해 모델 크기와 연산 능력을 늘려야 한다는 확장 법칙에 대한 기존의 통념에 도전장을 내밀었습니다. 회사는 비교적 덜 강력한 H800 칩을 사용해 성공을 거두었으며, 이 칩은 2023년 미국의 수출 통제로 중국 내 판매가 금지된 바 있습니다. 이러한 성과는 향후 AI 개발 방향에 대한 논의를 촉진하고 있습니다.

댓글 0
전체 1,366 / 185 페이지
(퍼플렉시티가정리한기사)'중국은주요기술기업들에대한재정적인센티브를강화하여,국내에서생산된인공지능프로세서를채택하는데이터센터에최대50%의에너지요금감면을제공하고있으며,이는자국기술부문을금지된미국반도체로부터독립시키려는베이징의가장공격적인시도를보여주고있습니다.간쑤성,귀저우성,내몽골의지방정부들은화웨이와캠브리콘과같은국내제조업체의AI칩을사용하는바이트댄스,알리바바,텐센트가운영하는데이터센터를대상으로보조금을확대했다고정책에정통한소식통들이전했습니다.일부보조금은1년치운영비용전체를상쇄할만큼상당한규모입니다.​전력할인은여전히미국의수출제한을받고있는엔비디아의고급칩을사용하는시설은제외됩니다.이러한조치는중국인터넷규제당국이반도체접근을둘러싼긴장이수개월간고조된후9월에국내기술기업들의엔비디아AI프로세서구매를금지한이후나온것입니다.​칩제재에대한전략적대응이보조금은중국기업들이에너지효율이낮은국내대체품으로전환할수밖에없게된후,자국산AI인프라채택을가속화하기위한베이징의최신노력을나타냅니다.이러한전환으로전력비용이크게증가하여중국설계프로세서에시스템을적응시키는기업들에게재정적부담이가중되었습니다.​도널드트럼프대통령은11월2일엔비디아의가장진보된블랙웰AI칩이미국전용으로만제공될것이라고밝히며제재를강화했습니다.트럼프는기자들에게"우리는그것들을중국에팔수없습니다.다른사람들에게도팔수없습니다"라고말했습니다.​중국의거대기술기업들은이러한변화에적극적으로대비해왔습니다.텐센트는9월에중국설계프로세서를지원하도록AI컴퓨팅인프라를"완전히적응"시켰다고발표했습니다.알리바바와바이두도자체설계한칩을사용하여AI모델을훈련시키기시작했으며,부분적으로엔비디아프로세서를대체하고있습니다.​국내반도체산업이탄력을받다이번정책지원은중국AI칩제조업체들이급속한성장을보이는가운데나온것입니다.Cambricon은2025년상반기에기록적인실적을보고했으며,Siyuan590프로세서에대한강력한수요에힘입어매출이44배증가한29억위안을기록했습니다.JPMorgan은Huawei가2025년에60만~65만개의AI칩을출하할것으로전망하고있습니다.​이러한진전에도불구하고,업계분석가들은중국칩이여전히Nvidia의성능능력에뒤처져있으며,국내대체품이NvidiaA100칩성능의약80%수준을달성하고있다고지적합니다.이번보조금은베이징이반도체자급자족에계속투자하는동안국내도입에대한경제적타당성을제시함으로써이러한격차를줄이는것을목표로하고있습니다.
1885 조회
0 추천
2025.11.04 등록
(퍼플렉시티가정리한기사)오픈AI의생성형인공지능챗GPT가국내에서월간활성사용자1300만명을넘어서며새로운이정표를세웠지만,신규설치건수는8개월만에100만건아래로떨어지면서국내AI시장의포화상태를시사하고있다.4일아이지에이웍스의모바일인덱스에따르면,챗GPT의10월국내월간활성사용자수(MAU)는1304만8025명으로집계되며모바일인덱스기준처음으로1300만명을돌파했다.이는지난3월500만명선에불과하던수치에서8개월만에2.6배증가한것이다.​신규설치급감,시장포화신호하지만10월신규설치건수는94만3153건으로전월134만8320건대비3분의2수준으로급감했다.신규설치가100만건을밑돈것은올해2월이후8개월만으로,4월466만8381건을정점으로지속적인하락세를보이고있다.​정보통신기술(ICT)업계에서는챗GPT국내이용자가사실상포화상태에진입했다는분석이나오고있다.한국은글로벌적으로도주목받는AI시장으로,오픈AI에따르면한국은유료챗GPT구독자수에서미국에이어전세계2위를기록하고있다.​카카오톡통합으로새로운전환점시장포화상황에서도주목할변화는지난10월말카카오톡에챗GPT가통합된점이다.사용자들은별도앱다운로드없이카카오톡채팅탭에서직접챗GPT에접근할수있게됐다.이러한통합으로신규설치유인은줄어들지만,사용자접근성은크게향상될것으로예상된다.​카카오는이번통합을통해연말까지챗GPT플러스신규구독자에게1개월환급프로모션을진행하고있으며,향후사용자증가에긍정적영향을미칠것으로전망된다.​글로벌적으로챗GPT는9월기준8억명의주간활성사용자를보유하고있으며,오픈AI는2025년말까지10억명달성을목표로하고있다.한편오픈AI는2027년을목표로최대1조달러규모의기업공개(IPO)를준비중인것으로알려졌다.
1679 조회
0 추천
2025.11.04 등록
(퍼플렉시티가정리한기사)한미반도체가차세대고대역폭메모리(HBM)생산을위한핵심장비'와이드TC본더'를2026년말출시한다고4일발표했다.이장비는업계가HBM5세대부터본격적용할것으로예상되는와이드HBM기술에최적화돼있다.​TC본더는인공지능(AI)반도체용HBM제조에필요한핵심장비로,D램다이를수직으로쌓아올릴때정밀한열과압력을가해접합하는공정에사용된다.한미반도체는현재HBM생산용TC본더시장에서전세계1위를차지하고있으며,HBM장비관련120여건의특허를보유하고있다.​와이드HBM으로기술방향전환최근메모리업계는차세대HBM에서D램다이사이즈를수평으로확대한'와이드HBM'개발을추진하고있다.HBM이고도화될수록더많은메모리용량과빠른데이터처리속도가요구되는데,20단이상고적층하는방식대신다이면적자체를확대하는방향으로개발중이다.​HBM다이면적이넓어지면실리콘관통전극(TSV)수와입출력인터페이스(I/O)수를안정적으로늘릴수있다.또한D램다이와인터포저를연결하는마이크로범프수도증가해메모리용량과대역폭을확보하면서도고적층방식대비열관리가용이하고전력효율도개선할수있다.​플럭스리스본딩기술적용새로운와이드TC본더는플럭스리스본딩기능을옵션으로추가할수있다.플럭스리스본딩은플럭스없이칩표면의산화막을감소시키는차세대접합기술로,기존방식대비잔류물세정공정이불필요해공정이단순화되고접합강도를높이면서도HBM두께를줄일수있다는장점이있다.​업계에서는와이드TC본더도입에따라차세대HBM의고적층생산을위해검토됐던하이브리드본더도입시기가한층늦춰질것으로전망하고있다.SK하이닉스는최근HBM5와HBM5E를2029년부터2031년사이에출시할계획이라고발표했다.​곽동신한미반도체회장은"HBM기술변화에발맞춰신기술을적용한와이드TC본더장비를선도적으로공급할계획"이라며"고객사의차세대HBM생산경쟁력강화에기여할것"이라고말했다.
1693 조회
0 추천
2025.11.04 등록
(퍼플렉시티가정리한기사)Google는2025년11월3일플로리다주립대학교및아칸소주와새로운교육파트너십을발표하여,전국의학생과근로자들에게무료AI기반교육을제공하는AIforEducationAccelerator프로그램을확대했습니다.플로리다주립대학교는GooglePeopleManagementEssentials인증프로그램을제공하는전국최초의교육기관중하나가되었으며,이는Gemini및NotebookLM과같은AI도구를사용하여리더십기술을가르치도록설계된8시간분량의자기주도학습과정입니다.Google의SchoolforLeaders가개발한이프로그램은SMART목표설정,프로젝트계획개발,커뮤니케이션맞춤화를포함한관리업무를위한인공지능실습경험을제공합니다.​대학들이AI교육통합에박차를가하다"우리는세계에서가장저명한기술기업중하나인Google과의파트너십과그것이우리학생들에게제공할혜택에대해기쁘게생각합니다"라고FSU경영대학학장MichaelD.Hartline이말했다.이대학교는플로리다에서Google의교육용AI가속기프로그램에참여하는유일한R1연구기관으로선정되었다.​동시에아칸소주는주상무부를통해Google과의파트너십을발표하여수요가높은기술분야의온라인직업훈련프로그램에대한무료액세스를제공한다고밝혔다.이이니셔티브에는GoogleAIEssentials와GooglePromptingEssentials를다루는새로운5시간분량의AI모듈이포함되어있으며,참가자들에게책임감있는AI관행과생성도구를위한효과적인프롬프트설계를가르친다.​18세이상의아칸소주민들은주의인력훈련네트워크를통해사이버보안,데이터분석,IT지원,디지털마케팅,프로젝트관리및사용자경험디자인분야의자격증을무료로취득할수있다.이파트너십은올해초발표된Google의웨스트멤피스40억달러규모데이터센터투자에이어이루어졌다.​디지털역량확대이니셔티브유사한파트너십이여러주에걸쳐나타나고있으며,오클라호마,테네시,메릴랜드,노스캐롤라이나가대학시스템과인력센터를통해비슷한프로그램을시작했습니다.이러한협력은2025년8월에발표된구글의10억달러규모AI교육투자약속을반영하며,이미100개이상의대학들이AIforEducationAccelerator프로그램에참여하고있습니다.​"구글에서우리는관리자에대한투자가모든사람을위한보다효과적이고협력적이며지원적인환경을조성하고비즈니스성과를이끌어낸다는것을직접경험했습니다"라고구글의최고학습책임자인브라이언글레이저는말했습니다.구글은학생들이최초의"AI네이티브"세대가되는동시에AI주도경제를위한인력준비의선두주자로자리매김하고있습니다.​11월발표는교육기관들이점점더경쟁이치열해지는취업시장에서기술중심직업을위해학생과근로자를준비시키기위해AI교육프로그램의도입이가속화되고있음을보여줍니다.
1706 조회
0 추천
2025.11.04 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입