AI 뉴스

딥씨크, R1 훈련 비용이 단 29만 4천 달러였음을 공개

페이지 정보

작성자 xtalfi
작성일 2025.09.18 02:46
304 조회
0 추천
0 비추천

본문

54383fe11e56d17fceb44cc59728749cwg0Z.png

(퍼플렉시티가 정리한 기사)

중국 AI 스타트업 DeepSeek은 획기적인 R1 모델 훈련 방식에 관한 새로운 세부 정보를 세계적인 권위지 네이처(Nature)의 동료검토 논문을 통해 발표했습니다. 이 논문에서는 기존 경쟁 모델 대비 극히 적은 비용으로 순수 강화학습만을 사용해 첨단 추론 능력을 달성한 방법을 공개했습니다.


항저우에 본사를 둔 이 회사는 자사의 R1 추론 모델 훈련 비용이 단 29만 4천 달러에 불과하며, 기반 베이스 모델의 개발 비용은 약 600만 달러였음을 처음으로 공개했습니다. 총 630만 달러가 소요된 것으로, 이는 미국의 기술 기업들이 개발한 경쟁 모델이 수천만 달러에 달하는 것과는 극명한 대조를 이룹니다.


순수 강화학습의 획기적인 발전


DeepSeek의 주요 혁신은 연구자들이 “순수 강화 학습(pure reinforcement learning)“이라고 부르는 방식을 사용해 R1을 개발한 점에 있으며, 이는 인간이 만든 예시에 의존하는 기존의 감독 학습(supervised learning) 방식과는 다른 접근법입니다. 이 과정에서 모델은 인간이 선택한 추론 방식에 따르도록 학습시키는 대신, 올바른 답변에 도달할 때 보상을 받도록 설계되었습니다.


네이처(Nature) 논문에 따르면, DeepSeek의 접근법은 모델이 인간이 제시한 전략을 따르지 않고도 자체적인 추론 전략을 개발하고 자신의 작업을 검증할 수 있는 능력을 갖추게 해주었습니다. 회사는 자체 시도에 대해 별도의 알고리즘을 사용하지 않고 추정치를 활용해 점수를 매길 수 있게 해주는 Group Relative Policy Optimization(GRPO)이라는 기법을 활용했습니다.


“이 모델은 AI 연구자들 사이에서 매우 영향력이 컸습니다,“라고 오하이오 주립대(Ohio State University) 콜럼버스 소재 AI 연구원인 Huan Sun은 말했습니다. “2025년 현재까지 LLM에서 강화 학습을 수행하는 거의 모든 연구가 어떻게든 R1로부터 영감을 받았을지도 모릅니다”.


5단계 훈련 과정


완전한 R1 학습 과정은 감독 학습(fine-tuning)과 강화 학습을 번갈아가며 진행하는 여러 단계로 구성되었습니다. 이 과정은 딥시크(DeepSeek)의 V3-Base 모델을 수천 개의 ‘콜드 스타트’ 데이터 포인트로 파인튜닝하는 것으로 시작했고, 이후 순수 강화 학습을 통해 추론 능력을 향상시켰습니다.


수렴에 가까워지면 시스템은 리젝션 샘플링(rejection sampling) 방식을 사용했습니다. 여기서 모델은 강화 학습 실행에서 성공적인 예시 중 최상의 예시를 선택해 자체 합성 훈련 데이터를 생성했습니다. 이 합성 데이터는 이후 글쓰기나 사실 기반 질문응답 등 다양한 영역에서 DeepSeek-V3-Base의 감독 학습 데이터와 통합되었습니다.


동료 평가 중인 최초의 주요 LLM


R1은 엄격한 동료 평가 과정을 거친 최초의 대형 언어 모델을 의미합니다. Nature 논문을 심사한 허깅페이스의 머신러닝 엔지니어 루이스 턴스톨은 이를 “매우 환영할 만한 선례”라고 평가하며, 훈련 과정이 공개되지 않으면 AI 시스템이 위험을 초래하는지 평가하기 어렵다고 언급했습니다.
이 동료 평가 과정에서 DeepSeek는 훈련에 사용된 데이터 유형과 안전 조치를 포함한 기술적 세부 사항에 대한 설명을 추가하게 되었습니다. 이 모델은 오픈소스 특성을 유지하면서도 OpenAI의 o1 모델에 필적하는 추론 벤치마크 성능을 달성하였습니다.


성능 및 접근성


Hugging Face에서 1월에 출시된 이후, R1은 복잡한 문제 해결을 위한 플랫폼에서 가장 많이 다운로드된 모델이 되었으며, 다운로드 수는 1,090만 회를 넘어섰습니다. 이 모델은 AIME 2024 수학 벤치마크에서 pass@1 점수 79.8%를 기록하여 OpenAI o1의 79.2%를 소폭 앞섰습니다.


DeepSeek의 혁신은 AI 개발 비용 및 성능 향상을 위해 모델 크기와 연산 능력을 늘려야 한다는 확장 법칙에 대한 기존의 통념에 도전장을 내밀었습니다. 회사는 비교적 덜 강력한 H800 칩을 사용해 성공을 거두었으며, 이 칩은 2023년 미국의 수출 통제로 중국 내 판매가 금지된 바 있습니다. 이러한 성과는 향후 AI 개발 방향에 대한 논의를 촉진하고 있습니다.

댓글 0
전체 407 / 1 페이지
Spotify가 AI 가 제작한 것으로 보이는 음원 7500만 개를 삭제 했다고 발표했다.그리고 AI 음악 금지 정책을 발표하고, 이에 대한 과감한 규제를 시작한다고.———더 강력한 사칭 규칙문제: 우리는 항상 기만적인 콘텐츠에 대한 정책을 가지고 있었습니다. 하지만 AI 도구는 당신이 좋아하는 아티스트의 보컬 딥페이크를 그 어느 때보다 쉽게 생성할 수 있게 해주었습니다.우리가 발표하는 것: 우리는 AI 음성 복제(및 기타 형태의 승인되지 않은 음성 사칭)에 대한 클레임을 처리하는 방법을 명확히 하는 새로운 사칭 정책을 도입하여 아티스트에게 더 강력한 보호와 더 명확한 의지를 제공합니다. 보컬 사칭은 사칭 아티스트가 사용을 승인한 경우에만 Spotify의 음악에서 허용됩니다.우리는 또한 업로더가 스트리밍 서비스를 통해 다른 아티스트의 프로필에 음악을 사기로 전달하는 또 다른 사칭 전술(AI 생성 또는 기타)로부터 보호하기 위해 투자를 늘리고 있습니다. 우리는 주요 아티스트 유통업체와 함께 새로운 예방 전술을 테스트하여 소스에서 이러한 공격을 더 잘 막을 수 있도록 준비하고 있습니다. 우리 쪽에서는 콘텐츠 불일치 프로세스에 더 많은 자원을 투자하여 검토 대기 시간을 줄이고 아티스트가 출시 전 상태에서도 "불일치"를 보고할 수 있도록 할 것입니다.
4 조회
0 추천
19:22 등록
(퍼플렉시티가 정리한 기사)삼성전자가 15일 '흰지팡이의 날'을 맞아 시각장애인과 저시력자를 위한 인공지능(AI) 가전 매뉴얼 '모두를 위한 사용법'을 공개했다고 발표했다. 이번 발표는 시각장애인의 가전제품 접근성을 획기적으로 개선하기 위한 포용적 기술 혁신의 일환이다.스타트업과의 협업으로 탄생한 혁신삼성전자는 올해 초 'C랩 아웃사이드' 스타트업 육성 프로그램에 선정된 시각보조앱 개발 스타트업 투아트(TUAT)와 협업해 이 매뉴얼을 개발했다. 투아트는 200여 개 이상의 국가에서 활용되는 AI 기반 시각보조앱 '설리번 플러스'를 제작한 회사로, 이미지 묘사와 문자 읽기 등 다양한 서비스를 제공하고 있다.새로운 매뉴얼은 삼성닷컴과 AI 기반 시각보조앱 '설리번 플러스'에서 확인할 수 있으며, 화면 읽기 기능과 하단 재생버튼을 통한 음성 설명을 제공한다.혁신적인 접근성 기능들매뉴얼의 가장 큰 특징은 제품 외관과 조작부 위치를 "눈앞에 그리듯" 상세하게 설명한다는 점이다. 예를 들어 '비스포크 AI 콤보' 세탁건조기의 먼지필터 청소 시 기존 매뉴얼이 그림으로 표현했던 것을 "세탁기 전면부 상단 오른쪽 모서리에 먼지필터 도어가 있습니다"와 같이 구체적으로 안내한다.부품 외관도 "손바닥보다 조금 큰 사이즈의 문이 먼지필터 도어입니다"처럼 촉각적 경험에 기반한 설명을 포함했다. 또한 음성인식 Q&A 기능을 탑재해 필요한 정보를 빠르게 찾을 수 있도록 했으며, 시각장애인을 위한 촉각 스티커 부착 위치도 안내한다.단계적 확대와 미래 계획매뉴얼은 2024년형과 2025년형 비스포크 AI 콤보 세탁건조기, 인피니트 AI 콤보 세탁건조기, 비스포크 AI 원바디 세탁기·건조기, 비스포크 AI 세탁기와 비스포크 AI 건조기 등 6개 제품에 우선 제공된다. 한국어 버전으로 시작해 향후 스페인어, 영어, 프랑스어를 포함한 20개 언어로 확대될 예정이다.양혜순 삼성전자 생활가전(DA)사업부 부사장은 "모든 사용자가 삼성 제품을 불편함 없이 사용할 수 있도록 접근성을 지속적으로 개선해 나갈 것"이라며 "앞으로도 혁신 기술과 사회적 가치를 결합해 더 나은 사용자 경험을 제공하겠다"고 밝혔다.흰지팡이의 날은 1980년 세계시각장애인연합회가 시각장애인들의 권리를 보호하고 사회적 관심을 이끌어내기 위해 제정한 기념일이다.
5 조회
0 추천
18:32 등록
(퍼플렉시티가 정리한 기사)아마존이 인공지능 분야에 대한 투자를 가속화함에 따라 인사(HR) 부서의 최대 15%를 감원할 준비를 하고 있다고 이 사안에 정통한 소식통이 화요일 밝혔다. 이번 감원은 전 세계적으로 1만 명이 넘는 인력을 보유하고 채용, HR 기술, 직원 지원 기능을 담당하는 회사의 People eXperience and Technology(PXT) 부서를 주로 대상으로 한다.이 같은 인력 감축은 앤디 재시 CEO가 올해 인공지능 인프라와 클라우드 컴퓨팅 역량에 1,000억 달러 이상을 쏟아붓는 동시에, 기업 인건비를 줄이기 위한 대대적인 전략의 최신 단계로 평가된다. 아마존의 핵심 소비자 사업 부문에서도 추가적인 감원이 예상되지만, 정확한 규모와 시기는 아직 명확하지 않다.AI 기반 인력 혁신이번 해고는 자시(Jassy)가 6월에 직원들에게 AI 도입으로 인해 회사 전반에 걸쳐 인력 감축이 있을 것이라고 경고한 메모에 따른 것이다. "AI를 회사 전체에 광범위하게 활용하면 효율성이 높아져 전체 기업 인력이 감축될 것으로 예상합니다,"라고 자시는 적었으며, 직원들에게 기술적 변화를 받아들이지 않으면 뒤처질 위험이 있다고 강조했다.아마존은 이미 역사상 최대 규모의 인력 감축을 단행했으며, 2022년 말부터 2023년 사이에 약 27,000개의 기업 직무를 없앴다. 이번 감축은 전통적인 성과 기반 감축과 달리, 아마존의 장기 AI 전환에 따른 전략적 구조조정이라는 점에서 차이가 있다.회사의 대규모 AI 투자는 내부 운영을 지원하고 기업 고객에게 서비스를 제공하기 위한 미래형 데이터 센터 구축을 포함한다. 아마존 웹 서비스는 자사의 AI 사업이 현재 수십억 달러 규모로 성장하고 있으며, 세 자릿수 성장률을 기록하고 있다고 밝혔다.휴일 채용, 전략적 변화 강조아마존이 휴일 시즌을 맞아 미국 전역의 창고와 물류 네트워크에서 25만 명의 임시직 근로자를 채용하겠다고 발표한 것과 동시에, 기업 정리해고가 뚜렷한 대조를 이룹니다. 시간당 평균 19달러 이상의 임금을 받는 이 임시직들은 지난 2년과 같은 수준의 채용 규모를 보이며, 회사가 휴일 수요 증가에 대비하고 있음을 보여줍니다.이러한 상반된 접근 방식은 아마존이 변화하는 인력 전략—화이트칼라 일자리 감축과 일선 운영 유지는 병행—을 추구하고 있음을 강조합니다. 이러한 조치는 회사가 트럼프 대통령의 관세 정책 아래에서의 경제적 불확실성을 헤쳐 나가면서, 마이크로소프트, 알파벳 등 경쟁사와의 AI 및 클라우드 컴퓨팅 분야 경쟁 우위 유지를 위해 분투하는 가운데 이루어지고 있습니다.업계 분석가들은 아마존의 이러한 접근 방식을 빅테크 전반의 광범위한 트렌드를 반영하는 것으로 보고 있습니다. 즉, 기업들이 선별적인 정리해고를 단행하는 한편, 미래 성장과 효율성을 이끌 AI 역량에 막대한 투자를 하고 있다는 뜻입니다.
5 조회
0 추천
18:30 등록
(퍼플렉시티가 정리한 기사)AMD는 월요일 산호세에서 열린 Open Compute Project Global Summit에서 Helios 랙 규모 AI 플랫폼을 공개하며, AI 인프라 시장에서 Nvidia의 지배력에 대한 과감한 도전을 알렸습니다. 이 발표는 Oracle이 2026년 3분기부터 50,000개의 AMD Instinct MI450 GPU를 배포하기로 약속하며 첫 주요 고객이 된 것과 동시에 이루어졌습니다.Helios 플랫폼은 급속도로 확장되는 AI 데이터 센터 시장에서 경쟁하기 위한 AMD의 가장 야심찬 노력을 나타내며, Meta의 새로운 Open Rack Wide 사양을 활용하여 Nvidia의 차기 Vera Rubin 아키텍처보다 50% 더 많은 메모리 용량을 제공한다고 회사는 주장합니다. 각 Helios 랙은 72개의 MI450 GPU를 탑재하고 있으며, 31TB의 HBM4 메모리와 1.4 PB/s의 총 대역폭으로 최대 1.4 엑사플롭스의 FP8 성능을 제공합니다.오라클 파트너십은 주요 검증을 의미합니다업계 분석가들에 따르면 약 35억~40억 달러 규모로 평가되는 오라클과의 계약은 AMD의 AI 전략에 대한 중요한 검증을 의미합니다. 오라클 클라우드 인프라스트럭처는 MI450 프로세서로 구동되는 최초의 공개 이용 가능한 AI 슈퍼클러스터의 일환으로 50,000개의 GPU를 배치할 예정이며, 2027년 이후 확장 계획을 가지고 있습니다."고객들은 극한의 확장성과 효율성을 위해 설계된 적응 가능하고 개방적인 컴퓨팅 솔루션을 필요로 합니다"라고 오라클은 파트너십 발표에서 밝혔습니다. 이번 배치는 MI450 GPU와 차세대 EPYC "Venice" CPU, 그리고 Pensando "Vulcano" 네트워킹 기술을 결합한 AMD의 통합 Helios 랙 디자인을 활용할 것입니다.AMD의 주가는 이번 발표 이후 시간외 거래에서 3% 이상 상승했으며, 이는 주로 회사의 최근 AI 파트너십에 힘입어 올해 85% 상승한 것에 더해진 것입니다. 오라클과의 계약은 AMD가 수년간 6기가와트의 GPU 용량을 제공하기로 OpenAI와 수십억 달러 규모의 계약을 체결한 지 불과 일주일 만에 이루어졌습니다.Nvidia 생태계에 대한 개방형 표준 도전Helios 플랫폼은 Nvidia의 독점 생태계에 대한 대안으로 개방형 표준을 촉진하는 AMD의 전략을 구현합니다. 기가와트 규모의 데이터 센터에 최적화된 더블 와이드 랙을 정의하는 Meta의 Open Rack Wide 사양을 기반으로 구축된 Helios는 UALink 및 Ultra Ethernet Consortium 아키텍처를 포함한 개방형 컴퓨팅 표준을 통합합니다.AMD 데이터 센터 솔루션 부문 수석 부사장인 Forrest Norrod는 "개방형 협업은 AI를 효율적으로 확장하는 핵심입니다"라고 말했습니다. "Helios를 통해 우리는 개방형 표준을 실제 배포 가능한 시스템으로 전환하고 있습니다".각 MI450 GPU는 최대 432GB의 HBM4 메모리와 19.6 TB/s의 메모리 대역폭을 제공하여 AMD에게 메모리 집약적인 AI 워크로드에서 잠재적인 이점을 제공합니다. 이 플랫폼은 또한 AMD가 이전 세대 대비 17.9배 높은 성능을 제공하며 Nvidia의 경쟁 시스템인 Vera Rubin과 비교하여 우수한 메모리 사양을 제공한다고 설명합니다.
5 조회
0 추천
18:29 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입