Loading...

AI 뉴스

딥씨크, R1 훈련 비용이 단 29만 4천 달러였음을 공개

페이지 정보

작성자 xtalfi
작성일 2025.09.18 02:46
3,156 조회
0 추천
0 비추천

본문

54383fe11e56d17fceb44cc59728749cwg0Z.png

(퍼플렉시티가 정리한 기사)

중국 AI 스타트업 DeepSeek은 획기적인 R1 모델 훈련 방식에 관한 새로운 세부 정보를 세계적인 권위지 네이처(Nature)의 동료검토 논문을 통해 발표했습니다. 이 논문에서는 기존 경쟁 모델 대비 극히 적은 비용으로 순수 강화학습만을 사용해 첨단 추론 능력을 달성한 방법을 공개했습니다.


항저우에 본사를 둔 이 회사는 자사의 R1 추론 모델 훈련 비용이 단 29만 4천 달러에 불과하며, 기반 베이스 모델의 개발 비용은 약 600만 달러였음을 처음으로 공개했습니다. 총 630만 달러가 소요된 것으로, 이는 미국의 기술 기업들이 개발한 경쟁 모델이 수천만 달러에 달하는 것과는 극명한 대조를 이룹니다.


순수 강화학습의 획기적인 발전


DeepSeek의 주요 혁신은 연구자들이 “순수 강화 학습(pure reinforcement learning)“이라고 부르는 방식을 사용해 R1을 개발한 점에 있으며, 이는 인간이 만든 예시에 의존하는 기존의 감독 학습(supervised learning) 방식과는 다른 접근법입니다. 이 과정에서 모델은 인간이 선택한 추론 방식에 따르도록 학습시키는 대신, 올바른 답변에 도달할 때 보상을 받도록 설계되었습니다.


네이처(Nature) 논문에 따르면, DeepSeek의 접근법은 모델이 인간이 제시한 전략을 따르지 않고도 자체적인 추론 전략을 개발하고 자신의 작업을 검증할 수 있는 능력을 갖추게 해주었습니다. 회사는 자체 시도에 대해 별도의 알고리즘을 사용하지 않고 추정치를 활용해 점수를 매길 수 있게 해주는 Group Relative Policy Optimization(GRPO)이라는 기법을 활용했습니다.


“이 모델은 AI 연구자들 사이에서 매우 영향력이 컸습니다,“라고 오하이오 주립대(Ohio State University) 콜럼버스 소재 AI 연구원인 Huan Sun은 말했습니다. “2025년 현재까지 LLM에서 강화 학습을 수행하는 거의 모든 연구가 어떻게든 R1로부터 영감을 받았을지도 모릅니다”.


5단계 훈련 과정


완전한 R1 학습 과정은 감독 학습(fine-tuning)과 강화 학습을 번갈아가며 진행하는 여러 단계로 구성되었습니다. 이 과정은 딥시크(DeepSeek)의 V3-Base 모델을 수천 개의 ‘콜드 스타트’ 데이터 포인트로 파인튜닝하는 것으로 시작했고, 이후 순수 강화 학습을 통해 추론 능력을 향상시켰습니다.


수렴에 가까워지면 시스템은 리젝션 샘플링(rejection sampling) 방식을 사용했습니다. 여기서 모델은 강화 학습 실행에서 성공적인 예시 중 최상의 예시를 선택해 자체 합성 훈련 데이터를 생성했습니다. 이 합성 데이터는 이후 글쓰기나 사실 기반 질문응답 등 다양한 영역에서 DeepSeek-V3-Base의 감독 학습 데이터와 통합되었습니다.


동료 평가 중인 최초의 주요 LLM


R1은 엄격한 동료 평가 과정을 거친 최초의 대형 언어 모델을 의미합니다. Nature 논문을 심사한 허깅페이스의 머신러닝 엔지니어 루이스 턴스톨은 이를 “매우 환영할 만한 선례”라고 평가하며, 훈련 과정이 공개되지 않으면 AI 시스템이 위험을 초래하는지 평가하기 어렵다고 언급했습니다.
이 동료 평가 과정에서 DeepSeek는 훈련에 사용된 데이터 유형과 안전 조치를 포함한 기술적 세부 사항에 대한 설명을 추가하게 되었습니다. 이 모델은 오픈소스 특성을 유지하면서도 OpenAI의 o1 모델에 필적하는 추론 벤치마크 성능을 달성하였습니다.


성능 및 접근성


Hugging Face에서 1월에 출시된 이후, R1은 복잡한 문제 해결을 위한 플랫폼에서 가장 많이 다운로드된 모델이 되었으며, 다운로드 수는 1,090만 회를 넘어섰습니다. 이 모델은 AIME 2024 수학 벤치마크에서 pass@1 점수 79.8%를 기록하여 OpenAI o1의 79.2%를 소폭 앞섰습니다.


DeepSeek의 혁신은 AI 개발 비용 및 성능 향상을 위해 모델 크기와 연산 능력을 늘려야 한다는 확장 법칙에 대한 기존의 통념에 도전장을 내밀었습니다. 회사는 비교적 덜 강력한 H800 칩을 사용해 성공을 거두었으며, 이 칩은 2023년 미국의 수출 통제로 중국 내 판매가 금지된 바 있습니다. 이러한 성과는 향후 AI 개발 방향에 대한 논의를 촉진하고 있습니다.

댓글 0
전체 1,366 / 323 페이지
(퍼플렉시티가 정리한 기사)마이크로소프트(Microsoft)는 Office 365 애플리케이션에 앤트로픽(Anthropic)의 인공지능 기술을 통합하고 있으며, 이는 오픈AI(OpenAI) 모델에만 의존하던 전략에서 벗어난 새로운 움직임입니다. 오늘 The Information에 보도된 바에 따르면, 이번 파트너십을 통해 두 회사의 기술이 마이크로소프트의 생산성 제품군 내에서 함께 작동할 예정이며, 개발자들은 앤트로픽의 최신 모델이 특정 자동화 작업에서 오픈AI를 능가할 수도 있다고 언급하고 있습니다.Anthropic 모델은 사무 작업에서 뛰어난 성과를 보입니다.Anthropic의 기술을 도입하기로 한 결정은 AI 기업의 최신 모델들, 특히 Claude Sonnet 4가 특정 Office 365 기능 자동화에서 우수한 성능을 보인 테스트 결과에 따른 것입니다. Microsoft의 생산성 앱용 AI 기능 개발에 참여한 개발자들은 Anthropic의 모델들이 특히 Excel에서의 재무 계산 실행 및 특정 지시 사항에 따른 PowerPoint 프레젠테이션 생성에서 뛰어남을 발견했습니다.이번 협력은 Microsoft가 Office 365의 AI 역량을 위해 이전까지 독점적으로 의존하던 OpenAI 기술에서 처음으로 의미 있는 전환을 시도하는 것입니다. 수년간 OpenAI의 모델이 Word, Excel, Outlook, PowerPoint 전반의 Copilot 기능을 구동해왔으나, 이제 회사는 AI 포트폴리오를 다각화하여 여러 공급업체를 포함시키고 있습니다.파트너십 갈등 속에서의 전략적 전환이 같은 상황은 마이크로소프트와 오픈AI 간의 관계에 대한 압력이 점점 커지고 있는 가운데 벌어지고 있습니다. 소프트웨어 거대 기업인 마이크로소프트는 2019년 이후 오픈AI에 130억 달러 이상을 투자했지만, 양사의 파트너십 계약은 2030년에 만료될 예정입니다. 최근 협상에서는 지분율, 수익 분배 방식, 독점적 권리 등에 초점이 맞춰졌으며, 오픈AI는 현재 20%인 마이크로소프트의 수익 지분을 줄이고자 하는 것으로 알려졌습니다.마이크로소프트는 자체 AI 모델인 MAI도 개발해왔으며, 이 모델들은 오픈AI와 Anthropic의 주요 모델과 비슷한 성능을 보이고 있습니다. 마이크로소프트는 8월에 MAI-Voice-1과 MAI-1-preview를 선보였는데, 이는 회사의 최초의 엔드투엔드 기반 모델로, 외부 AI 공급업체에 대한 의존도를 줄이려는 더 넓은 전략을 나타냅니다.AI 모델 포트폴리오 확장Anthropic의 통합은 Microsoft가 OpenAI를 넘어 인공지능 역량을 다양화하려는 광범위한 노력의 일부입니다. 이 회사는 Copilot 프레임워크 내에서 성능을 평가하기 위해 DeepSeek, Meta, xAI를 포함한 다양한 업체의 AI 모델을 테스트해 왔습니다. 이러한 다중 모델 접근법은 Microsoft가 다양한 비즈니스 분야에 맞춤형 솔루션을 제공하면서 단일 AI 공급업체에 대한 의존도를 줄일 수 있게 해줍니다.현재 Microsoft와 OpenAI의 파트너십은 OpenAI 모델을 자사 제품 및 클라우드 인프라에 통합할 독점 권한을 포함합니다. 하지만 최근 변경으로 인해 OpenAI의 Azure 독점권이 수정되어, Microsoft가 용량 요구를 충족하지 못할 경우 OpenAI가 다른 클라우드 공급자를 사용할 수 있는 '선매권(right of first refusal)' 모델로 전환되었습니다.Anthropic 기술의 Office 365 통합은 기업용 AI 환경이 변화하고 있음을 보여줍니다. 기업들은 점점 단일 공급업체 솔루션 대신, 유연성과 성능 최적화를 추구하고 있습니다. Microsoft와 Anthropic 모두 The Information의 보도 당시 파트너십 세부 사항에 대한 공식 입장을 내놓지 않았습니다.
3410 조회
0 추천
2025.09.11 등록
(퍼플렉시티가 정리한 기사)Google은 Android, iOS, 웹 플랫폼 전반에서 Gemini AI 앱에 오디오 파일 업로드 기능을 추가하여 사용자들의 압도적인 수요에 응답했습니다. Google Labs 및 Gemini 부사장 Josh Woodward는 오디오 지원이 앱 출시 이후 사용자들이 요청한 "가장 많은 요청"이었다고 X에서 발표했습니다.이 기능을 통해 사용자는 MP3, WAV, M4A 등 일반적인 오디오 파일 형식을 앱의 업로드 인터페이스를 통해 직접 업로드할 수 있습니다. 무료 사용자는 하루 5번의 프롬프트로 총 10분 길이의 오디오를 처리할 수 있으며, Google AI Pro 또는 AI Ultra 플랜 구독자는 최대 3시간 분량의 오디오 업로드로 훨씬 더 많은 용량을 제공받습니다.멀티모달 AI 역량 확장이 오디오 기능은 사용자가 Gemini와 상호작용하는 방식을 변화시키며, 인터뷰를 기록하거나 음성 메모를 분석하고 강의 녹음을 검색 가능한 콘텐츠로 변환하는 등 새로운 사용 사례를 가능하게 합니다. 사용자는 이제 회의 녹음을 업로드하여 실행 항목이 포함된 요약을 요청하거나 대학 강의를 제출해 학습 가이드 생성을 요청할 수 있습니다.이번 업데이트는 Gemini를 수개월 전부터 오디오 업로드 기능을 지원해 온 OpenAI의 ChatGPT와 같은 경쟁업체들과 기능적 균형에 더 가까워지게 합니다. Android Police에 따르면, 올해 초 파일 업로드가 제공된 이후로 오디오 지원이 없었던 것은 "이상한 누락"이었다고 합니다.더 넓어진 제미니 생태계 업데이트오디오 기능과 함께, 구글은 AI 모드 검색 경험을 인도어, 인도네시아어, 일본어, 한국어, 브라질 포르투갈어 등 5개 새로운 언어로 확장했습니다. 이번 확장에서는 Gemini 2.5 기술의 맞춤형 버전을 활용하여 단순 번역을 넘어 문화적으로 적합한 답변을 제공합니다.구글은 또한 NotebookLM 연구 보조 도구를 80개 이상의 언어에서 사용자 맞춤형 보고서 형식을 지원하도록 업그레이드하여, 사용자가 업로드한 자료로부터 학습 가이드, 요약 문서, 블로그 글, 퀴즈 등을 생성할 수 있도록 했습니다. 이제 이 플랫폼은 사용자의 선호도에 따라 특정 구조, 스타일, 톤으로 보고서를 작성할 수 있습니다.오디오 업로드 기능은 빠르게 진화하는 인공지능 분야에서 멀티모달 기능의 중요성이 커지고 있는 가운데 구글이 자사의 AI 도구를 더욱 다양하고 경쟁력 있게 만들기 위한 지속적인 노력을 보여줍니다. 이러한 기능은 사용자 참여와 생산성 향상에 중요하게 작용합니다.
3389 조회
0 추천
2025.09.11 등록
KBS가 만든 다큐 'AI 시대, 인간의 일'모든 산업에 AI가 혁명적으로 도입되는 지금, 일자리 우려가 많습니다.한번 볼만한 내용입니다.요약- AI 도입이 빠르게 확산: 자동차 공장과 물류창고 등 생산현장에 AI 기반 로봇과 휴머노이드가 투입되어, 인간의 일자리가 줄어들고 있음.- AI는 인간 능력의 '증폭기': 한 사람이 AI를 활용해 여러 업무(시장조사, 코딩, 광고제작 등)를 동시에 처리할 수 있게 되면서 직급, 부서의 의미가 약해지고 신입채용도 감소.- AI의 문제해결 능력: 의료영상 판독, 축산·물류관리 등 데이터가 충분한 분야에서 AI가 빠르고 정확한 해법을 제시. 생성형 AI는 영상 제작 등 창작 과정 자체를 혁신.- 일자리 위기와 해법도 AI: AI 활용 능력이 곧 생존력이 되면서, AI를 잘 활용하는 개인과 기업만이 살아남음. 국가 차원에서도 'AI 주권'과 세계 2위 전략의 필요성 강조.
2880 조회
0 추천
2025.09.10 등록
Anthropic의 Claude AI가 채팅창에서 직접 PDF, 파워포인트 슬라이드, 엑셀 스프레드시트, 워드 문서를 생성하고 편집할 수 있는 새로운 기능을 9일 출시했다.이 기능은 사용자가 필요한 파일을 설명하고 관련 데이터를 업로드하면 Claude가 개인용 컴퓨터 환경에서 코드를 작성해 즉시 사용 가능한 파일을 생성해준다. 파일 생성 기능은 현재 Max(월 100달러, 약 13만 8,500원), Team, Enterprise 플랜 사용자에게 프리뷰로 제공되며, Pro 사용자는 몇 주 내에 접근할 수 있게 된다. PDF 보고서를 파워포인트 슬라이드로 변환하거나 원시 데이터를 차트와 통계 분석이 포함된 완성된 문서로 변환하는 등 포맷 간 작업도 지원한다.사용자는 설정에서 "업그레이드된 파일 생성 및 분석" 기능을 활성화한 후 완성된 문서를 다운로드하거나 구글 드라이브에 직접 저장할 수 있다.
3329 조회
0 추천
2025.09.10 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입