AI 뉴스

DeepSeek, AI 비용을 절반으로 줄이는 모델 출시

페이지 정보

작성자 xtalfi
작성일 2025.09.30 04:29
38 조회
0 추천
0 비추천

본문

fcf479c22f7f91e4f33ec4d7f1408300VRSE.png

(퍼플렉시티가 정리한 기사)

중국 AI 개발사 딥시크(DeepSeek)는 2025년 9월 29일, 혁신적인 희소 주의(sparse attention) 기술을 도입한 실험적 V3.2-Exp 모델을 출시했습니다. 이 기술은 최상급 AI 시스템에 견줄만한 성능을 유지하면서도 컴퓨팅 비용을 획기적으로 줄였습니다. 이번 출시로 항저우에 기반을 둔 딥시크는 오픈AI(OpenAI)와 같은 글로벌 기업은 물론, 알리바바 그룹 홀딩 리미티드의 Qwen 플랫폼을 포함한 국내 경쟁사들과의 AI 경쟁에서 강력한 경쟁자로 부상했습니다.


V3.2-Exp 모델은 딥시크 희소 주의(DeepSeek Sparse Attention, DSA)을 처음으로 선보였으며, 이는 “처음으로 미세하게 조정된 희소 주의(fine-grained sparse attention)를 달성했다”고 개발자 플랫폼 허깅페이스(Hugging Face)에 발표했습니다. 이 기술로 인해 모델은 기존 방식보다 최대 64배 빠르게 긴 텍스트 시퀀스를 처리할 수 있으며, 메모리 사용량도 30~40% 절감되고 훈련 효율성은 약 50% 향상되었습니다.

 

시장 교란을 일으키는 가격 인하, 경쟁 압박 신호


DeepSeek는 API 가격을 50% 이상 인하했다고 발표했으며, 캐시 히트 시 입력 비용은 백만 토큰당 $0.07까지, 캐시 미스 시에는 백만 토큰당 $0.56까지 낮아졌습니다. 이러한 극적인 가격 인하는 2025년 1월 R1 모델 출시 당시 엔비디아 등 기존 AI 선두 기업에 위협이 될 것을 우려한 투자자들로 인해 6,000억 달러 규모의 주식 시장 매도 사태가 발생했던 회사의 과거 시장 교란을 떠올리게 합니다.


이 회사는 V3.2-Exp를 “차세대 아키텍처로 가는 중간 단계”라고 설명했으며, 이는 V3.1-Terminus 기반 위에 구축되었습니다. 추론, 코딩, 수학적 문제 해결 등 다양한 분야의 벤치마크 테스트에서 새로운 모델은 전작과 동등한 성능을 보이면서도 상당한 효율성 향상을 제공했습니다. 프로그래밍 챌린지에서 V3.2-Exp는 Codeforces 벤치마크 기준 V3.1-Terminus가 기록한 2,046점 대비 2,121점을 획득했습니다.

 

스파스 어텐션 기술이 핵심 AI 효율성 문제를 해결합니다


혁신적인 희소 주의력 메커니즘(sparse attention mechanism)은 대형 언어 모델에서 가장 중요한 계산상의 과제 중 하나를 해결합니다. 이 메커니즘은 긴 텍스트 시퀀스에서 관련된 부분만 선택적으로 처리함으로써 효율성을 높입니다. 기존의 주의력 메커니즘(attention mechanism)은 모든 토큰 간의 관계를 계산해야 하며, 이는 시퀀스가 길어질수록 계산 복잡도가 제곱으로 증가하여 매우 비싸집니다.


DeepSeek가 구현한 방식은 ‘라이트닝 인덱서(lightning indexer)’라고 불리는 도구를 사용하여 토큰의 중요도를 점수화하고 순위를 매깁니다. 각 쿼리에 가장 관련성이 높은 연결만 유지하는 방식으로, 불필요한 계산을 줄입니다. 이 선택적 접근법을 통해 최대 128,000 토큰의 긴 시퀀스도 처리할 수 있으며, 출력 품질은 완전한 주의력 메커니즘과 거의 동일하게 유지됩니다.


이 모델은 즉시 DeepSeek의 앱, 웹 플랫폼 및 API 서비스를 통해 이용 가능하며, 오픈소스는 Hugging Face 및 GitHub 저장소를 통해 제공됩니다. 또한, 회사는 다양한 하드웨어 환경에서 연구와 배포를 용이하게 하기 위해 TileLang과 CUDA 형식의 GPU 커널도 공개했습니다.

이번 발표는 글로벌 AI 경쟁이 격화되는 가운데 이루어졌습니다. 특히 중국 기업들이 인공지능 개발 분야에서 미국의 우위를 정면으로 도전하고 있습니다. 최근 분석에 따르면, 중국 기업들은 독자적인 AI 개발 경로를 구축하여 비용 효율성과 빠른 배치를 극대화함으로써 서방 경쟁사들을 이미 따라잡거나 앞서가고 있는 것으로 나타났습니다.

댓글 0
전체 326 / 5 페이지
오픈AI가 ChatGPT 에 더이상 레딧을 참고하지 않는다는 소식이 알려졌다.또한 마케팅 전략가 안드레아보소니가 X에 아래와 같은 트윗과 함께Apparently ChatGPT is not using Reddit much anymore for their answers. I guess they realized that what random people say can’t be considered a trusted source after all. You can all stop spamming it with your fake brand mentions now.레딧의 트래픽이 줄어든 것으로 보이는 그래프를 올렸다.원래 챗GPT는 지난해 5월 레딧과 파트너십을 맺고 레딧의 콘텐츠를 사용해 왔다.하지만 레딧에 올라온 게시글의 진위와 품질에 문제를 제기하는 경우가 늘어나면서 챗GPT가 이러한 결정을 하게 된 것으로추측된다. 이로써 레딧의 트래픽이 줄어들었고, 주가도 크게 하락했다고.
19 조회
0 추천
10.02 등록
비즈니스 인사이더는 바이브 코딩에 대한 관심이 떨어지고 있는 것으로 보인다고 보도했다.AI 기술로 텍스트 프롬프트만으로 앱이나 웹사이트를 만들 수 있는 바이브 코딩 툴들의 사용 트래픽이 올해 초 정점을 찍은 뒤 최근 급격히 감소하는 추세를 보이고 있습니다.Lovable, Vercel의 v0 등 대표적인 바이브 코딩 서비스들의 트래픽이 각각 40%, 64% 하락하는 등 눈에 띄는 감소가 나타나고 있습니다. Bolt.new와 Replit도 각각 27%, 소폭 감소를 기록했습니다.많은 스타트업들이 매출(ARR) 급증을 내세웠지만, 월 단위 구독자 이탈이 높아 수익성에 의문이 제기되고 있습니다. 특히 헤비 유저의 높은 비용 부담과 가격 인상 등이 신규 고객 유입과 유지에 장애가 되고 있습니다. Bolt.new는 고객 이탈을 막기 위해 신규 기능과 구독 모델을 도입하는 등 대응에 나서고 있고, Wix·GoDaddy와 같은 기존 대형 업체들도 인수합병이나 신규 서비스 도입으로 시장 가능성을 모색하고 있습니다.바이브 코딩 툴은 현재 AI 친화적인 얼리어답터 중심의 실험 단계에 머물러 있으면, '마지막 5%'의 완성도 문제 등 대중화에는 한계가 있다는 평가입니다. 다만, 관련 논의와 시장은 당분간 지속될 것으로 보입니다.
19 조회
0 추천
10.02 등록
OpenAI가 최근 초대제로 공개한 틱톡 스타일 소셜 앱 'Sora'가 출시 하루 만에 매우 사실적인 샘 올트먼 딥페이크 영상이 급속히 퍼지고 있다. 사용자는 올트먼이 가상 돼지농장, 포켓몬 필드 등에서 기상천외한 행동을 하는 모습을 볼 수 있으며, 저작권 침해가 의심되는 콘텐츠가 다수 포함되어 있다.'Sora'의 핵심 기능 중 하나는 사용자 본인의 얼굴 데이터를 업로드해 '카메오' 영상, 즉 자가 딥페이크를 만들 수 있다는 점이다. 초기 등록 과정에서 카메오 생성 가능 대상을 '나만', '승인된 사람', '상호 친구', '모든 사람' 등으로 선택할 수 있으며, 샘 올트먼은 모든 사용자에게 카메오 허용을 해 논란이 커지고 있다.앱은 부적절한 복장이나 상황을 걸러내는 안전 장치를 가지고 있지만, 실제로 완벽하게 이를 막지 못하는 사례도 발견되었다. 사용자는 자신의 딥페이크를 쉽게 만들어 공개할 수 있고, IP 및 ChatGPT 사용 이력 등 개인정보 기반에서 추천 영상이 만들어진다.앱은 콘텐츠 저작권자에게 명시적 동의가 없어도 자료를 사용할 수 있게 설계되어 법적·윤리적 문제가 제기되고 있다. 유명 인물이나 캐릭터를 무분별하게 활용한 영상이 급속히 확산되며, 저작권자들이 직접 미사용 요청을 해야만 해당 자료 사용이 제한된다.딥페이크 기술이 대중화되며 사기, 괴롭힘, 허위 정보 유포 등 부작용의 우려가 커지고 있다. 실제로 대통령 도널드 트럼프도 자신의 SNS에 민주당 의원 딥페이크 영상을 올리는 등 정치적 악용 사례가 발생 중이며, Sora가 대중에게 완전히 공개될 경우 사회적 파장이 뒤따를 것으로 예상된다.
23 조회
0 추천
10.02 등록
(퍼플렉시티가 정리한 기사)코인베이스 의 임원 존 다고스티노는 인공지능 에이전트가 금융 시장에서 효과적으로 작동하기 위해서는 암호화폐 인프라가 필요하다고 주장하면서, 전통적인 은행 시스템을 구식 기술에 비유했다. 그의 발언은 AI와 블록체인 기술의 융합이 가속화되고 있음을 강조했다.화요일 CNBC의 스쿼크박스에서 코인베이스 기관 전략 책임자인 다고스티노는 AI를 “무한히 확장 가능한 지능”으로, 블록체인을 “무한히 확장 가능한 진실의 원천”으로 묘사하며 두 기술의 자연스러운 호환성을 강조했다. 그의 발언은 AI 암호화폐 분야의 시가총액이 약 300억 달러에 달할 정도로 폭발적으로 성장하고, 기관 투자자들이 2025년 4분기 이전에 자율 거래 시스템을 도입하기 위해 경쟁하고 있는 가운데 나왔다.전통 금융은 인공지능의 속도를 따라잡을 수 없다다고스티노는 수십 년 전에 개발된 인프라에 기반을 둔 기존 금융 시스템이 AI 에이전트가 요구하는 실시간 기계 간 거래를 처리할 수 없다고 강조했다. 그는 “영화를 다이얼업 모뎀으로 스트리밍하려고 하지는 않을 것”이라며 “이 AI 에이전트들에게 그 모뎀보다 더 오래된 금융 시스템에서 거래하라고 요구하지도 않을 것”이라고 말했다.이 임원은 AI 에이전트가 인간 트레이더와 달리 정보를 확인하기 위해 멈추지 않고 초당 수천 건의 결정을 내린다고 경고했다. 다고스티노는 CNBC와의 인터뷰에서 “AI 에이전트가 사람을 대신해 운영된다면, ‘진정한 정보 출처’에 기반해 작동해야 한다. 그렇지 않으면 재앙이 될 수 있다”고 말했다.AI 에이전트는 이미 암호화폐 플랫폼 전반에 널리 퍼져 있으며, 이들은 Web3 애플리케이션을 구축하고, 토큰을 출시하며, 서비스 및 프로토콜과 자율적으로 상호작용하고 있다. 일부 플랫폼에서는 트레이딩을 위한 AI 에이전트를 실험하고 있는데, 이는 해당 기술이 금융 시장에 점점 더 통합되고 있음을 보여준다.AI-암호화폐 통합의 급속한 성장융합이 빠르게 가속화되고 있습니다. 최근 데이터에 따르면 투자 매니저의 54%가 이미 인공지능(AI)을 연구 프로세스에 적용하고 있습니다. AI 기반 트레이딩 봇은 현재 일일 암호화폐 거래량의 약 40%를 차지하고 있으며, AI 관련 온체인 활동은 2025년 1월 이후 86% 급증하여 450만 명의 일일 사용자가 AI 기반 탈중앙화 애플리케이션과 상호작용하고 있습니다.D’Agostino는 또한 비트코인이 금보다 가지는 강점에 대해 논의하며, 비트코인이 “프로그래밍 가능하고, 디지털이며, 이동 측면에서 무한하게 확장 가능하다”고 강조한 뒤, 금리가 하락함에 따라 암호화폐에 대해 낙관적인 입장을 유지했습니다. 그러나 그는 갑작스러운 기관의 도입에 대한 기대를 경계하며, 연기금과 기금들이 “매우 조심스러우며”, “무모하게 뛰어드는 렘밍과는 다르다”고 설명했습니다.이 발언은 주요 암호화폐 기업들이 블록체인 기술을 다음 세대 AI 기반 금융 서비스의 필수 인프라로 삼으며, 업계가 빠르게 주류 금융으로 확장되고 있음을 강조합니다.
19 조회
0 추천
10.02 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입