Loading...

AI 뉴스

딥씨크, R1 훈련 비용이 단 29만 4천 달러였음을 공개

페이지 정보

작성자 xtalfi
작성일 2025.09.18 02:46
308 조회
0 추천
0 비추천

본문

54383fe11e56d17fceb44cc59728749cwg0Z.png

(퍼플렉시티가 정리한 기사)

중국 AI 스타트업 DeepSeek은 획기적인 R1 모델 훈련 방식에 관한 새로운 세부 정보를 세계적인 권위지 네이처(Nature)의 동료검토 논문을 통해 발표했습니다. 이 논문에서는 기존 경쟁 모델 대비 극히 적은 비용으로 순수 강화학습만을 사용해 첨단 추론 능력을 달성한 방법을 공개했습니다.


항저우에 본사를 둔 이 회사는 자사의 R1 추론 모델 훈련 비용이 단 29만 4천 달러에 불과하며, 기반 베이스 모델의 개발 비용은 약 600만 달러였음을 처음으로 공개했습니다. 총 630만 달러가 소요된 것으로, 이는 미국의 기술 기업들이 개발한 경쟁 모델이 수천만 달러에 달하는 것과는 극명한 대조를 이룹니다.


순수 강화학습의 획기적인 발전


DeepSeek의 주요 혁신은 연구자들이 “순수 강화 학습(pure reinforcement learning)“이라고 부르는 방식을 사용해 R1을 개발한 점에 있으며, 이는 인간이 만든 예시에 의존하는 기존의 감독 학습(supervised learning) 방식과는 다른 접근법입니다. 이 과정에서 모델은 인간이 선택한 추론 방식에 따르도록 학습시키는 대신, 올바른 답변에 도달할 때 보상을 받도록 설계되었습니다.


네이처(Nature) 논문에 따르면, DeepSeek의 접근법은 모델이 인간이 제시한 전략을 따르지 않고도 자체적인 추론 전략을 개발하고 자신의 작업을 검증할 수 있는 능력을 갖추게 해주었습니다. 회사는 자체 시도에 대해 별도의 알고리즘을 사용하지 않고 추정치를 활용해 점수를 매길 수 있게 해주는 Group Relative Policy Optimization(GRPO)이라는 기법을 활용했습니다.


“이 모델은 AI 연구자들 사이에서 매우 영향력이 컸습니다,“라고 오하이오 주립대(Ohio State University) 콜럼버스 소재 AI 연구원인 Huan Sun은 말했습니다. “2025년 현재까지 LLM에서 강화 학습을 수행하는 거의 모든 연구가 어떻게든 R1로부터 영감을 받았을지도 모릅니다”.


5단계 훈련 과정


완전한 R1 학습 과정은 감독 학습(fine-tuning)과 강화 학습을 번갈아가며 진행하는 여러 단계로 구성되었습니다. 이 과정은 딥시크(DeepSeek)의 V3-Base 모델을 수천 개의 ‘콜드 스타트’ 데이터 포인트로 파인튜닝하는 것으로 시작했고, 이후 순수 강화 학습을 통해 추론 능력을 향상시켰습니다.


수렴에 가까워지면 시스템은 리젝션 샘플링(rejection sampling) 방식을 사용했습니다. 여기서 모델은 강화 학습 실행에서 성공적인 예시 중 최상의 예시를 선택해 자체 합성 훈련 데이터를 생성했습니다. 이 합성 데이터는 이후 글쓰기나 사실 기반 질문응답 등 다양한 영역에서 DeepSeek-V3-Base의 감독 학습 데이터와 통합되었습니다.


동료 평가 중인 최초의 주요 LLM


R1은 엄격한 동료 평가 과정을 거친 최초의 대형 언어 모델을 의미합니다. Nature 논문을 심사한 허깅페이스의 머신러닝 엔지니어 루이스 턴스톨은 이를 “매우 환영할 만한 선례”라고 평가하며, 훈련 과정이 공개되지 않으면 AI 시스템이 위험을 초래하는지 평가하기 어렵다고 언급했습니다.
이 동료 평가 과정에서 DeepSeek는 훈련에 사용된 데이터 유형과 안전 조치를 포함한 기술적 세부 사항에 대한 설명을 추가하게 되었습니다. 이 모델은 오픈소스 특성을 유지하면서도 OpenAI의 o1 모델에 필적하는 추론 벤치마크 성능을 달성하였습니다.


성능 및 접근성


Hugging Face에서 1월에 출시된 이후, R1은 복잡한 문제 해결을 위한 플랫폼에서 가장 많이 다운로드된 모델이 되었으며, 다운로드 수는 1,090만 회를 넘어섰습니다. 이 모델은 AIME 2024 수학 벤치마크에서 pass@1 점수 79.8%를 기록하여 OpenAI o1의 79.2%를 소폭 앞섰습니다.


DeepSeek의 혁신은 AI 개발 비용 및 성능 향상을 위해 모델 크기와 연산 능력을 늘려야 한다는 확장 법칙에 대한 기존의 통념에 도전장을 내밀었습니다. 회사는 비교적 덜 강력한 H800 칩을 사용해 성공을 거두었으며, 이 칩은 2023년 미국의 수출 통제로 중국 내 판매가 금지된 바 있습니다. 이러한 성과는 향후 AI 개발 방향에 대한 논의를 촉진하고 있습니다.

댓글 0
전체 409 / 55 페이지
(퍼플렉시티가 정리한 기사)이더리움(Ethereum) 재단은 월요일에 인공지능(AI) 연구팀을 공식적으로 출범시키며, 블록체인 네트워크를 자율적인 AI 시스템과 떠오르는 “머신 경제”의 기반 계층으로 만들기 위한 전략적 행보에 나섰다.연구 과학자 다비데 크라피스(Davide Crapis)는 소셜 미디어를 통해 “dAI 팀”의 출범 소식을 알렸으며, AI 에이전트가 중개자 없이 금융 거래를 수행할 수 있도록 하고, 기업이 통제하는 AI 인프라에 대한 탈중앙화된 대안을 구축하는 이중 미션을 이 이니셔티브의 목표로 제시했다.기계 경제 인프라 구축dAI 팀은 두 가지 주요 목표에 집중할 것입니다: 로봇과 AI 에이전트가 이더리움 네트워크상에서 직접 결제하고 활동을 조율할 수 있는 AI 기반 경제를 구축하는 것, 그리고 공개적이고 검증 가능하며 검열 저항적인 인프라를 제공하는 분산형 AI 스택을 개발하는 것입니다.“이더리움은 AI를 더 신뢰할 수 있게 만들고, AI는 이더리움을 더 유용하게 만듭니다,“라고 Crapis는 발표에서 밝혔습니다. “더 많은 지능형 에이전트가 거래할수록, 가치와 평판을 위한 중립적인 베이스 레이어가 더 필요하게 됩니다”.Blockworks에 따르면, 이번 이니셔티브는 AI 에이전트 프로토콜 표준화를 목표로 하며, 이더리움이 AI가 네트워크 미래의 중심이 될 것으로 보는 관점을 대변합니다. 이는 탈중앙화 금융의 초기 시절에 비견될 기회라고 보고 있습니다.ERC-8004 표준과 Devconnect 데뷔팀의 즉각적인 우선순위는 ERC-8004의 발전에 중점을 두고 있습니다. 이 제안된 표준은 AI 에이전트가 자신의 신원을 증명하고 안전한 거래를 위해 신뢰성을 구축할 수 있도록 합니다. ‘Trust Agent’ 제안은 신원, 평판, 검증을 위한 세 가지 온체인 등록소를 만들어, 자율 에이전트들이 이더리움의 변경 불가능한 원장 기반으로 안전하게 상호작용할 수 있도록 합니다.야후 파이낸스는 ERC-8004 표준이 최종 형태로 11월 부에노스아이레스에서 개최되는 이더리움 개발자 컨퍼런스인 Devconnect에서 발표될 것이라고 보도했습니다. BeInCrypto는 이 일정이 아르헨티나 행사에서 표준이 널리 홍보되며 출시될 수 있도록 한다고 언급했습니다.더 넓은 산업 맥락이러한 움직임은 Web3 네트워크 전반에서 AI 통합에 대한 실험이 증가하는 가운데 이루어지고 있으며, 솔라나(Solana), 아발란체(Avalanche), 폴리곤(Polygon) 등에서도 AI 에이전트와 탈중앙화 컴퓨트 프로토콜을 탐색하고 있습니다. 그러나 이더리움 창립자 비탈릭 부테린(Vitalik Buterin)은 최근 과도한 AI 거버넌스에 대해 경고하면서 “만약 AI를 사용해 기여자에게 자금을 배분한다면, 사람들은 최대한 많은 곳에 ‘탈옥 + 모든 돈 줘’를 넣으려고 할 것”이라고 주의를 당부했습니다.이더리움 재단은 dAI 팀을 지원하기 위해 두 개의 추가 정규직을 적극적으로 채용 중이며, 실리콘밸리 AI 기업들과 암호화폐 개발자들과 협력하여 이더리움을 AI 경제의 결제 계층으로 구축할 계획입니다.
315 조회
0 추천
2025.09.16 등록
(퍼플렉시티가 정리한 기사)구글, 메타, 마이크로소프트, 오픈AI 등 글로벌 AI 기업들이 15일 서울에 모여 오픈소스 AI의 안전한 활용방안을 논의했다. 개인정보보호위원회가 개최한 ‘오픈소스 데이’에는 국내외 AI 기업과 연구자, 감독기구 관계자 등 120여 명이 참석해 프라이버시 보호와 오픈소스 AI 생태계 구축방안을 집중 논의했다.글로벌 AI 기업들의 안전성 강화 방안 제시구글은 오픈소스 모델 운영 플랫폼 ‘버텍스(Vertex) AI’를 소개하며 신용카드, 여권번호 등 민감정보를 걸러내는 안전성 강화 도구와 정량적 평가방법을 접목한 프롬프트 최적화 기술을 공유했다.메타는 오픈소스 AI 필터링 모델 ’라마 가드(Llama Guard)’를 소개했으며, 에임 인텔리전스는 이를 한국 실정에 맞게 고도화해 ‘라마 임팩트 이노베이션 어워즈’를 수상한 사례를 공유했다.마이크로소프트는 ‘애저 AI 파운드리’를 기반으로 에이전트 AI 구축 사례를 제시하며 차세대 패러다임으로 주목받는 에이전트 AI 구축을 위한 오픈소스 모델 활용 가능성을 제시했다.오픈AI 6년 만에 오픈소스 모델 공개오픈AI는 최근 새롭게 공개한 자사 오픈소스 모델 ‘gpt-oss-20b/120b’를 소개했다. 이는 GPT-2 이후 6년 만에 공개된 오픈소스 모델로, 120억 개와 20억 개의 파라미터를 각각 보유한 두 가지 버전이다.오픈AI는 이 모델들이 지닌 경제적, 사회적 가치와 함께 안전성 우려와 책임성, 글로벌 차원의 논의 필요성 등 오픈소스 확산 과정에서 직면한 과제도 제기했다.개인정보 보호와 안전성 확보 방안 논의개인정보보호위원회가 사전 실시한 설문조사에 따르면, 응답자 70명 중 62%가 오픈소스 도입·활용 경험이 있다고 응답했으며, 77%는 오픈소스 모델 활용 시 안전성을 고려한 경험이 있다고 밝혔다.참석자들은 오픈소스 AI 도입 과정에서 개인·민감정보 필터링 및 검증 절차, 미세조정 시 고려사항, 레드팀 테스트 설계 방안 등 안전성 및 신뢰성 보장 방안을 집중적으로 논의했다.네이버는 자사 오픈소스 모델 ‘하이퍼클로바X’와 함께 AI 편향성과 불안전성 관련 데이터셋을 공개했으며, 서비스 개발 과정에서 민감한 정보는 수집하지 않는다고 강조했다.국제적 공감대 형성이날 행사는 16일 개막한 제47차 글로벌 프라이버시 총회(GPA)의 사전 부대행사로, 한국을 비롯한 영국, 이탈리아, 브라질 등 4개국 개인정보 감독기구가 패널로 참석한 라운드테이블도 진행됐다.최장혁 개인정보보호위원회 부위원장은 “이번 오픈소스 데이는 에이전트 AI와 같은 혁신 서비스의 기반이 되는 오픈소스 AI 생태계와 개인정보 보호를 함께 고민하는 국내 첫 공개 논의의 장”이라고 의미를 부여했다.
323 조회
0 추천
2025.09.15 등록
(퍼플렉시티가 정리한 기사)OpenAI는 지금까지 ChatGPT 사용 방식에 대한 가장 포괄적인 분석을 발표했으며, 여성 사용자가 현재 전체의 52%를 차지하고 있다고 밝혔다. 이는 초기에는 사용자의 80%가 남성이던 남성 중심 플랫폼에서 극적인 변화가 일어난 것이다. 이 연구는 하버드 대학 경제학자 데이비드 데밍과 공동 저술한 미국국립경제연구소(NBER)의 작업 논문으로, 챗GPT의 주간 7억 명 사용자로부터 나온 150만 건의 대화를 분석했다.성별 격차가 거의 동등하게 좁혀지다인구 통계의 변화는 빠르게 일어났다. 2024년 1월에는 판별할 수 있는 이름을 가진 사용자 중 일반적으로 여성적인 비율이 37%에 불과했으나, 2025년 7월에는 그 수치가 절반 이상으로 증가했다. 이러한 변화는 OpenAI의 수석 이코노미스트 Ronnie Chatterji가 플랫폼이 초기 사용자층을 넘어 사람들이 “실용적인” 활용법을 발견하면서 확장된 것이라고 설명한다.이와 같은 변화는 초기 사용 패턴을 감안할 때 특히 두드러진다. Axios에 따르면, 초기 추정치에서는 ChatGPT 사용자의 최대 80%가 남성이었던 것으로 나타났다. 이 변화는 AI 도구가 점점 주류로 자리 잡으면서 더 폭넓게 채택되고 있음을 보여주며, 현재 ChatGPT는 전 세계 성인 인구의 약 10%가 사용하는 것으로 추산된다.실용적인 작업이 사용 패턴을 지배한다연구에 따르면 챗GPT 사용의 80%가 실용적 조언, 정보 검색, 글쓰기 지원이라는 세 가지 주요 범주에 속한다고 합니다. AI가 고급 코딩을 통해 직업을 대체한다는 대중의 인식과 달리, 프로그래밍은 전체 사용량에서 상대적으로 작은 비중만을 차지하고 있습니다.글쓰기는 가장 일반적인 업무 관련 작업으로 나타나, 챗GPT가 기존 검색 엔진과 비교해 디지털 결과물을 생성하는 독특한 능력을 갖추고 있음을 보여줍니다. 소비자 사용의 약 30%는 업무 관련이고, 70%는 업무 외 환경에서 발생하고 있으며, 두 범주 모두 계속해서 성장하고 있습니다.부유한 국가를 넘어선 글로벌 확장ChatGPT는 특히 개발도상국에서 빠른 국제적 성장을 이루었습니다. 2025년 5월까지 최저 소득 국가에서의 도입 성장률은 최고 소득 국가에서의 성장률보다 4배 이상 높았습니다. 연구자들에 따르면 이러한 패턴은 이 기술이 사치스러운 도구에서 필수적인 인프라로 변화하고 있음을 시사합니다.본 연구는 자동화된 도구를 활용해 개별 메시지에 대한 사람의 검토 없이 사용 패턴을 분류함으로써, 방대한 사용자 기반 전체의 행동을 분석하면서 사용자 프라이버시를 보호했습니다. 이 결과는 생성형 AI가 실제로 어떻게 활용되고 있는지 이론적 적용이 아닌 실질적인 사용 현황을 대규모로 실증적으로 보여주는 최초의 자료입니다.
343 조회
0 추천
2025.09.15 등록
(퍼플렉시티가 정리한 기사)OpenAI 이사회 의장 브렛 테일러는 최근 더 버지와의 인터뷰에서 인공지능 산업이 닷컴 시대와 유사한 거품을 겪고 있다는 점을 인정하면서도, 변화의 잠재력에 대해 낙관적인 견해를 보였습니다.AI 에이전트 스타트업 시에라의 CEO로도 활동 중인 테일러는, “AI에서 엄청난 손실을 입는 사람이 분명히 나올 것”이라고 경고했던 OpenAI CEO 샘 올트만의 발언에 동조했습니다. 인터뷰에서 테일러는 “AI가 경제를 변화시킬 것이며, 앞으로 인터넷처럼 막대한 경제적 가치를 창출할 것이라는 점은 사실이라고 생각합니다. 동시에 우리는 거품 안에 있고, 많은 사람들이 큰 손실을 겪게 될 것이라고도 생각합니다”라고 말했습니다.이러한 인정은 인공지능 투자 수준이 전례 없이 높아지는 가운데 나왔는데, 2025년 2분기에만 벤처캐피털의 투자액이 910억 달러에 달했습니다. OpenAI 역시 올해 초 860억 달러였던 기업가치를 거의 두 배인 1,500억 달러로 평가받으며 자금 조달을 모색 중인 것으로 알려졌습니다.닷컴 시대와의 유사점 그리기테일러는 현재 AI 환경을 1990년대 후반의 닷컴 버블과 직접적으로 비교하며, 역사적 선례가 기술적 버블이 진정한 혁신과 공존할 수 있음을 보여준다고 주장했다. 그는 “1999년에 있던 사람들은 다들 어느 정도 맞았다”고 언급하며, 아마존과 구글과 같은 기업들이 수많은 실패에도 불구하고 닷컴 시대에 탄생했다는 점을 지적했다.비즈니스 인사이더(Business Insider) 보도에 따르면, 테일러는 현재 AI 시장에 “엉터리”(snake oil)가 존재한다는 점을 인정하면서도, “실제로 매우 큰 가치가 창출되고 있다”고 강조했다. 그는 기술적 버블은 대규모 기술 변화와 함께 일어나는 경우가 많으며, 실험과 혁신을 촉진해 결국 지속 가능한 기업들이 탄생하는 데 기여할 수 있다고 주장했다.AI 투자 급증이 지속 가능성에 대한 우려를 불러일으킨다AI 지출 열풍은 여러 산업 분야에서 뚜렷하게 드러나고 있습니다. 주요 기술 기업들은 AI 인프라에 기록적인 자금을 쏟아붓고 있으며, 아마존, 마이크로소프트, 알파벳, 그리고 메타 등은 2025년 자본 지출에 총 3,000억 달러를 쓸 것으로 예상됩니다. 미국의 데이터 센터 건설 지출만 해도 6월에 사상 최고치인 400억 달러를 기록했습니다.하지만 이러한 투자들이 지속 가능할지에 대한 우려도 커지고 있습니다. MIT 연구에 따르면 기업의 생성형 AI 프로젝트 중 95%가 수십억 달러의 투자에도 불구하고 의미 있는 재무적 성과를 내지 못한 것으로 나타났습니다. 오픈AI 역시 야심찬 2029년 1,000억 달러 매출 목표를 추구하는 과정에서 올해 50억 달러를 손실로 기록할 것으로 전망되고 있습니다.시에라의 10억 달러 규모 AI 에이전트 베팅테일러가 인공지능(AI)의 미래에 대해 자신감을 갖는 데는 자신의 스타트업 성공이 뒷받침되고 있다. 고객 서비스 AI 에이전트를 개발하는 시에라는 최근 9월에 이전 평가액의 두 배가 넘는 100억 달러의 기업가치로 3억 5,000만 달러의 투자를 유치했다. 이 회사는 SoFi, Ramp, Brex와 같은 주요 브랜드를 포함해 “수백 개의 고객사”에 서비스를 제공한다고 주장하고 있다.테일러는 AI 에이전트가 전체 직업을 자동화하고 소프트웨어-서비스 모델 내에서 “조 단위 달러 시장기회”를 만들 수 있다고 내다봤다. 시에라의 플랫폼은 기업이 복잡한 고객 서비스 업무를 처리할 수 있는 AI 에이전트를 구축할 수 있도록 도와주며, 테일러는 이를 디지털 비즈니스 인터페이스의 미래로 보고 있다.버블 위험을 인정하면서도 테일러는 AI의 장기적 전망에 대해 계속해서 낙관적이다. 그는 현재의 투자 열풍이 자율형 AI 시스템 등 분야에서의 진보를 가속화하고 있다고 주장한다. 그의 관점은 단기적으로 시장 조정이 있더라도 근본 기술이 경제를 근본적으로 재편할 것이라는 실리콘밸리의 넓은 정서를 반영한다.
360 조회
0 추천
2025.09.15 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입