Loading...

AI 뉴스

DeepSeek, AI 비용을 절반으로 줄이는 모델 출시

페이지 정보

작성자 xtalfi
작성일 2025.09.30 04:29
2,885 조회
0 추천
0 비추천

본문

fcf479c22f7f91e4f33ec4d7f1408300VRSE.png

(퍼플렉시티가 정리한 기사)

중국 AI 개발사 딥시크(DeepSeek)는 2025년 9월 29일, 혁신적인 희소 주의(sparse attention) 기술을 도입한 실험적 V3.2-Exp 모델을 출시했습니다. 이 기술은 최상급 AI 시스템에 견줄만한 성능을 유지하면서도 컴퓨팅 비용을 획기적으로 줄였습니다. 이번 출시로 항저우에 기반을 둔 딥시크는 오픈AI(OpenAI)와 같은 글로벌 기업은 물론, 알리바바 그룹 홀딩 리미티드의 Qwen 플랫폼을 포함한 국내 경쟁사들과의 AI 경쟁에서 강력한 경쟁자로 부상했습니다.


V3.2-Exp 모델은 딥시크 희소 주의(DeepSeek Sparse Attention, DSA)을 처음으로 선보였으며, 이는 “처음으로 미세하게 조정된 희소 주의(fine-grained sparse attention)를 달성했다”고 개발자 플랫폼 허깅페이스(Hugging Face)에 발표했습니다. 이 기술로 인해 모델은 기존 방식보다 최대 64배 빠르게 긴 텍스트 시퀀스를 처리할 수 있으며, 메모리 사용량도 30~40% 절감되고 훈련 효율성은 약 50% 향상되었습니다.

 

시장 교란을 일으키는 가격 인하, 경쟁 압박 신호


DeepSeek는 API 가격을 50% 이상 인하했다고 발표했으며, 캐시 히트 시 입력 비용은 백만 토큰당 $0.07까지, 캐시 미스 시에는 백만 토큰당 $0.56까지 낮아졌습니다. 이러한 극적인 가격 인하는 2025년 1월 R1 모델 출시 당시 엔비디아 등 기존 AI 선두 기업에 위협이 될 것을 우려한 투자자들로 인해 6,000억 달러 규모의 주식 시장 매도 사태가 발생했던 회사의 과거 시장 교란을 떠올리게 합니다.


이 회사는 V3.2-Exp를 “차세대 아키텍처로 가는 중간 단계”라고 설명했으며, 이는 V3.1-Terminus 기반 위에 구축되었습니다. 추론, 코딩, 수학적 문제 해결 등 다양한 분야의 벤치마크 테스트에서 새로운 모델은 전작과 동등한 성능을 보이면서도 상당한 효율성 향상을 제공했습니다. 프로그래밍 챌린지에서 V3.2-Exp는 Codeforces 벤치마크 기준 V3.1-Terminus가 기록한 2,046점 대비 2,121점을 획득했습니다.

 

스파스 어텐션 기술이 핵심 AI 효율성 문제를 해결합니다


혁신적인 희소 주의력 메커니즘(sparse attention mechanism)은 대형 언어 모델에서 가장 중요한 계산상의 과제 중 하나를 해결합니다. 이 메커니즘은 긴 텍스트 시퀀스에서 관련된 부분만 선택적으로 처리함으로써 효율성을 높입니다. 기존의 주의력 메커니즘(attention mechanism)은 모든 토큰 간의 관계를 계산해야 하며, 이는 시퀀스가 길어질수록 계산 복잡도가 제곱으로 증가하여 매우 비싸집니다.


DeepSeek가 구현한 방식은 ‘라이트닝 인덱서(lightning indexer)’라고 불리는 도구를 사용하여 토큰의 중요도를 점수화하고 순위를 매깁니다. 각 쿼리에 가장 관련성이 높은 연결만 유지하는 방식으로, 불필요한 계산을 줄입니다. 이 선택적 접근법을 통해 최대 128,000 토큰의 긴 시퀀스도 처리할 수 있으며, 출력 품질은 완전한 주의력 메커니즘과 거의 동일하게 유지됩니다.


이 모델은 즉시 DeepSeek의 앱, 웹 플랫폼 및 API 서비스를 통해 이용 가능하며, 오픈소스는 Hugging Face 및 GitHub 저장소를 통해 제공됩니다. 또한, 회사는 다양한 하드웨어 환경에서 연구와 배포를 용이하게 하기 위해 TileLang과 CUDA 형식의 GPU 커널도 공개했습니다.

이번 발표는 글로벌 AI 경쟁이 격화되는 가운데 이루어졌습니다. 특히 중국 기업들이 인공지능 개발 분야에서 미국의 우위를 정면으로 도전하고 있습니다. 최근 분석에 따르면, 중국 기업들은 독자적인 AI 개발 경로를 구축하여 비용 효율성과 빠른 배치를 극대화함으로써 서방 경쟁사들을 이미 따라잡거나 앞서가고 있는 것으로 나타났습니다.

댓글 0
전체 1,366 / 297 페이지
(퍼플렉시티가 정리한 기사)구글 은 30억 달러 규모의 인공지능 데이터 센터 계약의 일환으로 지분 5.4%를 인수할 예정입니다. 이번 계약은 기술 대기업의 AI 인프라에 대한 공격적인 진출과 암호화폐 채굴 산업의 고성능 컴퓨팅 분야로의 전환을 부각시킵니다.수요일 발표된 10년 계약에 따르면, 구글은 약 2,400만 주의 사이퍼 주식 매입 워런트를 받게 되며, 동시에 AI 클라우드 플랫폼 플루이드스택(Fluidstack)의 임대 의무 14억 달러도 보증합니다. 사이퍼는 텍사스주 콜로라도 시티에 위치한 바버레이크(Barber Lake) 사이트에서 중요 IT 부하 168메가와트를 공급할 예정이며, 운영은 2026년 9월까지 시작될 것으로 예상됩니다.비트코인에서 인공지능 컴퓨팅까지이번 계약은 전통적인 비트코인 채굴 사업에서 급성장하는 AI 분야를 겨냥한 이중 목적의 인프라 제공업체로 발전한 사이퍼(Cipher)에게 극적인 변화를 의미합니다. 회사의 이러한 변화는 기존의 전력을 활용하고 냉각 기술 전문성을 바탕으로 더 고부가가치인 AI 워크로드를 확보하려는 암호화폐 채굴업계의 광범위한 트렌드를 반영합니다.사이퍼의 CEO 타일러 페이지(Tyler Page)는 “우리는 Fluidstack과 함께 고성능 컴퓨팅(HPC) 데이터 센터를 개발하게 되어 매우 기쁩니다. 구글을 사이퍼의 투자자로 맞이할 날을 기대하고 있습니다”라고 말했습니다. 이번 거래를 통해 사이퍼는 2.4기가와트의 고성능 컴퓨팅 우선 파이프라인을 앞세운 주요 AI 데이터 센터 개발업체로 자리매김하게 되었습니다.2017년에 설립된 플루이드스택(Fluidstack)은 AI 학습과 추론을 위한 GPU 클러스터의 온디맨드 접근을 제공하며, 주요 테크 기업과 AI 연구소를 포함한 고객에게 서비스를 제공하고 있습니다. 런던에 기반을 둔 이 스타트업은 최근 프랑스 정부와 110억 달러 규모의 계약을 체결해 원자력 기반 AI 슈퍼컴퓨터를 구축하기로 했습니다.AI 인프라 투자 급증이번 파트너십은 AI 인프라에 대한 전례 없는 투자가 이뤄지는 가운데 체결되었습니다. 전 세계 AI 인프라 지출은 2025년에 3,750억 달러, 2026년에는 5,000억 달러에 이를 것으로 전망됩니다. 맥킨지는 AI 연산 수요를 충족하기 위해 2030년까지 전 세계 데이터 센터에 6.7조 달러의 투자가 필요할 것으로 추정하고 있습니다.구글의 투자는 기존의 인프라 확장 전략과 맞물려 있습니다. 최근 버지니아에 90억 달러, 영국에 50억 파운드의 AI 및 클라우드 시설 투자 약속도 포함됩니다. 사이퍼와의 계약은 2회의 5년 연장 옵션이 행사될 경우 최대 70억 달러로 확대될 수 있습니다.이번 발표 이후 사이퍼 주가는 장전 거래에서 11% 급등하며, 연초 대비 205%의 수익률에 추가 상승세를 보였습니다. 이번 파트너십은 비트코인 채굴업체들이 보유한 전력 용량과 기술 전문성을 활용해 급성장하는 인공지능 산업에서 수익을 창출하려는 전략적 전환을 입증하는 사례입니다.
3043 조회
0 추천
2025.09.26 등록
(퍼플렉시티가 정리한 기사)소매 투자자들이 주식 선정을 위해 인공지능 챗봇을 점점 더 많이 활용하면서, 로보어드바이저 시장이 폭발적으로 성장해 2029년에는 업계 분석가들이 예측한 4,709억 1천만 달러의 수익을 기록할 것으로 예상되고 있습니다. 이는 지난해의 617억 5천만 달러에서 600% 이상의 급증입니다.ChatGPT가 오는 11월 세 번째 생일을 앞두고 있는 가운데, 이미 최소 13%의 소매 투자자들이 이 인기 챗봇을 주식 선정에 활용하고 있으며, 추가로 50%는 투자 결정을 위해 AI 도구 사용을 고려할 것이라고 11,000명의 글로벌 소매 투자자를 대상으로 한 증권사 eToro의 조사 결과 밝혀졌습니다. 이 현상은 한때 대형 금융기관과 전문 투자자에게만 한정되었던 투자 분석을 대중화시켰습니다.전직 월스트리트 애널리스트들이 AI 도입을 주도하다스위스 은행 UBS에서 거의 20년 동안 기업을 분석해온 Jeremy Leung은 올해 초 직장을 잃은 후 이러한 경향을 대표하고 있습니다. 비싼 블룸버그 단말기나 프리미엄 시장 데이터 서비스에 접근할 수 없게 된 Leung은 이제 그의 멀티-자산 투자 포트폴리오 관리를 위해 ChatGPT를 활용하고 있습니다.“심지어 단순한 ChatGPT 도구만으로도 많은 일을 할 수 있고, 내가 이전에 했던 워크플로우를 상당 부분 복제할 수 있다”고 Leung은 말했으나, 이런 도구들이 유료 서비스 뒤에 있는 데이터에 접근하지 못해 중요한 분석을 놓칠 수 있다는 점을 경고했습니다.ChatGPT의 효과를 극대화하기 위해 Leung은 “당신이 숏 분석가라고 가정하고, 이 종목의 숏 투자 논거를 제시하라”와 같이 구체적인 프롬프트를 만들고, “SEC 공시와 같은 신뢰할 수 있는 소스만 사용하라”고 AI에게 지시합니다. 이러한 접근은 테크놀로지의 한계를 이해하는 AI 보조 투자자들 사이에서 점점 정교해지고 있는 트렌드를 반영합니다.AI 포트폴리오가 전통적인 펀드보다 더 높은 성과를 기록하다실질적인 결과는 눈에 띄게 나타났습니다. 비교 조사 업체 Finder가 2023년 3월 ChatGPT에 부채 수준, 지속적인 성장, 경쟁 우위 등 기준에 따라 우량 기업의 주식을 선별하도록 요청했을 때, 이렇게 선정된 38종목 포트폴리오의 수익률은 거의 55%에 달했습니다. 이 포트폴리오에는 AI 선두주자인 엔비디아 , 전자상거래 대기업 아마존 , 그리고 프로터 & 갬블 , 월마트 와 같은 필수소비재 기업이 포함되어 있으며, 영국에서 가장 인기 있는 10대 펀드의 평균 수익률을 거의 19%포인트 웃돌았습니다.이러한 성공은 미국 증시가 사상 최고치 부근을 맴도는 가운데, S&P 500 지수는 2024년에 23% 급등한 데 이어 올해도 13% 상승한 상황에서 이루어졌습니다. 그러나 전문가들은 이러한 성과가 모든 시장 상황에서 지속되지 않을 수 있다고 경고합니다.업계의 고위험 전략 경고인상적인 결과에도 불구하고, 금융업계 전문가들은 AI 기반 주식 선별이 상당한 위험을 수반한다고 경고한다. 전 세계적으로 3,000만 명의 사용자를 보유한 eToro의 영국 지사장 댄 모츨스키(Dan Moczulski)는 “ChatGPT나 Gemini 같은 범용 모델을 마치 예언 도구처럼 여길 때 위험이 발생한다”고 경고한다.모츨스키는 시장 분석을 위해 특별히 훈련된 AI 플랫폼의 사용을 옹호하며, “일반적인 AI 모델은 수치와 날짜를 잘못 인용하거나, 지나치게 미리 정해진 내러티브에 의존하며, 과거 가격 동향에 지나치게 의지해 미래를 예측하려 할 수 있다”고 지적한다.ChatGPT 자체도 사용자에게 전문적인 금융 조언에 의존하지 말라고 경고하며, 모기업인 OpenAI 또한 얼마나 많은 사람들이 투자 결정을 위해 챗봇을 사용하는지에 대한 데이터를 공개하지 않았다. AI 도구에 대한 열광은 일반 투자자들이 시장 하락 시 잠재적 손실을 방지하기 위한 적절한 리스크 관리 전략을 구사하고 있는지에 대한 우려를 낳고 있다.
3086 조회
0 추천
2025.09.25 등록
(퍼플렉시티가 정리한 기사)스포티파이 는 목요일에 인공지능 음악 정책에 대한 대대적인 변화를 발표하며, 딥페이크와 스팸을 막기 위한 새로운 안전장치를 도입했다고 밝혔습니다. 또한 지난 1년 동안 플랫폼에서 7천5백만 개가 넘는 문제 있는 트랙을 삭제했다고 공개했습니다. 이 스트리밍 대기업의 세 가지 전략은 AI 기반 사기와 맞서면서도 기술의 정당한 예술적 활용을 지원하는 데 목적이 있으며, AI 생성 콘텐츠가 음악 플랫폼을 급격히 증가하는 상황에 대한 스포티파이의 가장 포괄적인 대응을 의미합니다.새로운 기준이 AI 투명성과 스팸을 겨냥하다회사는 DDEX(Digital Data Exchange)가 개발한 AI 음악 공개를 위한 새로운 업계 표준을 도입할 예정이며, 이를 통해 아티스트와 레이블이 창작 과정에서 인공지능이 어떻게 사용되었는지 정확하게 명시할 수 있습니다. 이 시스템 하에서는 크리에이터가 AI가 보컬을 생성했는지, 악기를 연주했는지, 또는 후반 작업을 처리했는지 여부를 나타낼 수 있어, 단순한 “AI 여부” 구분을 넘어서게 됩니다.Spotify의 글로벌 마케팅 및 정책 총괄인 샘 두보프(Sam Duboff)는 언론 브리핑에서 “AI의 활용은 하나의 스펙트럼이 될 것이며, 아티스트와 프로듀서들은 창작 프로세스의 여러 부분에서 AI를 결합하게 될 것입니다”라고 말했습니다. “이 업계 표준은 보다 정확하고 세밀한 공개를 가능하게 합니다.”Spotify는 또한 올가을 대량 업로드, 중복 트랙, SEO 조작, 로열티 지급을 노린 인위적으로 짧은 곡 등 음악 스팸을 겨냥한 강화된 필터를 도입할 예정입니다. 해당 필터는 문제 upload자를 식별하여 이들의 트랙을 알고리즘 추천에서 제거하지만, 완전히 삭제하지는 않을 예정입니다.AI 음악 논란에 따른 강경 조치정책 개편은 제대로 된 공개 없이 AI가 생성한 아티스트들이 엄청난 성공을 거두며 논란이 커지는 것에 대한 대응으로 이루어졌다. 완전히 AI로 만들어진 것이 확인되기 전까지 스포티파이에서 월 100만 명 이상의 청취자를 모은 ‘벨벳 선다운’은 플랫폼의 투명성 문제를 보여주는 대표적인 사례였다. 이 밴드의 곡들은 인기 플레이리스트와 사용자들의 ‘Discover Weekly’ 추천곡에 등장했으나, AI로 생성된 프로필 사진과 가짜 밴드 멤버 약력 등 불분명한 부분을 레딧 이용자들이 지적하기도 했다.스포티파이 경영진은 플랫폼이 고의로 AI 생성 콘텐츠를 홍보해 저작권료 지급을 줄이려 한다는 지속적인 소문에 대해 직접 해명했다. 정책 브리핑에서 샘 두보프는 “그런 소문들은 단호하게, 그리고 완전히 사실이 아닙니다”라고 밝혔다. “스포티파이는 어떤 음악도 직접 생성하지 않습니다. 저희가 음악을 소유하지도 않습니다. 스포티파이에 있는 모든 음악, 100%는 라이선스를 받은 제3자가 만든 것이고, 업로드한 것입니다.” 회사는 정당한 AI 활용은 지지하는 한편, 노스캐롤라이나의 뮤지션이 AI를 이용해 ‘수십만 곡’을 만들어 1천만 달러 이상 부정 스트리밍 로열티를 챙긴 사례 등과 같은 사기에는 강력하게 대응할 것임을 강조했다.
3027 조회
0 추천
2025.09.25 등록
(퍼플렉시티가 정리한 기사)SK텔레콤 이 AI 사업을 총괄하는 사내회사(CIC) 출범을 발표하며 2030년 연매출 5조원 달성을 목표로 5년간 5조원을 투자한다고 밝혔다. 유영상 CEO가 25일 전 구성원 대상 타운홀 미팅을 열고 이같은 내용을 발표했다.AI CIC 조직 체계와 목표AI CIC는 에이닷(A.) 서비스, 기업용 에이닷 비즈, AI 데이터센터 사업, 글로벌 AI 제휴투자, AI R&D, 메시징·인증 사업 등 전사 AI 관련 기능과 조직을 통합해 운영된다. 유영상 CEO가 직접 AI CIC 대표를 겸임하며, 세부 조직 개편은 10월 말 시행될 예정이다.유 CEO는 “급변하는 AI 환경 변화에 따라 위기와 기회가 공존하는 AI 골든타임을 놓치지 않기 위해서는 수요자 관점의 내부 AI 혁신과 공급자 관점의 AI 사업 혁신이 필요하다”며 AI CIC 출범 배경을 설명했다.사업 전략과 성과 기반AI CIC는 AI 수요(B2C, B2B)와 공급(AI 인프라)의 안정적 선순환을 통해 독자 생존 가능한 수익 구조를 확보할 계획이다. B2C는 에이닷을 중심으로 국내외 가입자 기반을 확대하고, B2B는 에이전틱 AI 서비스를 통한 생산성 향상 입증과 제조 AI 분야 레퍼런스 확보에 집중한다.SK텔레콤은 지난 3년간 AI 컴퍼니 전환을 통해 에이닷 1000만 가입자 확보, 독자 AI 파운데이션 모델 선정, 울산 AI DC 착수, 글로벌 파트너십 구축 등의 성과를 달성했다고 발표했다. 에이닷은 정식 출시 22개월 만에 가입자 1000만명을 돌파했으며, 월간 활성사용자수(MAU)는 약 810만명에 달한다.울산 AI 데이터센터의 경우 7조원을 투자해 축구장 11개 규모의 연면적 2만평 이상으로 건설되며, 6만장 가량의 GPU를 수용할 수 있는 국내 최대 규모의 AI 전용 하이퍼스케일 데이터센터로 2027년 말부터 단계적 가동을 시작할 예정이다.
3055 조회
0 추천
2025.09.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입