Loading...

AI 뉴스

DeepSeek, AI 비용을 절반으로 줄이는 모델 출시

페이지 정보

작성자 xtalfi
작성일 2025.09.30 04:29
1,045 조회
0 추천
0 비추천

본문

fcf479c22f7f91e4f33ec4d7f1408300VRSE.png

(퍼플렉시티가 정리한 기사)

중국 AI 개발사 딥시크(DeepSeek)는 2025년 9월 29일, 혁신적인 희소 주의(sparse attention) 기술을 도입한 실험적 V3.2-Exp 모델을 출시했습니다. 이 기술은 최상급 AI 시스템에 견줄만한 성능을 유지하면서도 컴퓨팅 비용을 획기적으로 줄였습니다. 이번 출시로 항저우에 기반을 둔 딥시크는 오픈AI(OpenAI)와 같은 글로벌 기업은 물론, 알리바바 그룹 홀딩 리미티드의 Qwen 플랫폼을 포함한 국내 경쟁사들과의 AI 경쟁에서 강력한 경쟁자로 부상했습니다.


V3.2-Exp 모델은 딥시크 희소 주의(DeepSeek Sparse Attention, DSA)을 처음으로 선보였으며, 이는 “처음으로 미세하게 조정된 희소 주의(fine-grained sparse attention)를 달성했다”고 개발자 플랫폼 허깅페이스(Hugging Face)에 발표했습니다. 이 기술로 인해 모델은 기존 방식보다 최대 64배 빠르게 긴 텍스트 시퀀스를 처리할 수 있으며, 메모리 사용량도 30~40% 절감되고 훈련 효율성은 약 50% 향상되었습니다.

 

시장 교란을 일으키는 가격 인하, 경쟁 압박 신호


DeepSeek는 API 가격을 50% 이상 인하했다고 발표했으며, 캐시 히트 시 입력 비용은 백만 토큰당 $0.07까지, 캐시 미스 시에는 백만 토큰당 $0.56까지 낮아졌습니다. 이러한 극적인 가격 인하는 2025년 1월 R1 모델 출시 당시 엔비디아 등 기존 AI 선두 기업에 위협이 될 것을 우려한 투자자들로 인해 6,000억 달러 규모의 주식 시장 매도 사태가 발생했던 회사의 과거 시장 교란을 떠올리게 합니다.


이 회사는 V3.2-Exp를 “차세대 아키텍처로 가는 중간 단계”라고 설명했으며, 이는 V3.1-Terminus 기반 위에 구축되었습니다. 추론, 코딩, 수학적 문제 해결 등 다양한 분야의 벤치마크 테스트에서 새로운 모델은 전작과 동등한 성능을 보이면서도 상당한 효율성 향상을 제공했습니다. 프로그래밍 챌린지에서 V3.2-Exp는 Codeforces 벤치마크 기준 V3.1-Terminus가 기록한 2,046점 대비 2,121점을 획득했습니다.

 

스파스 어텐션 기술이 핵심 AI 효율성 문제를 해결합니다


혁신적인 희소 주의력 메커니즘(sparse attention mechanism)은 대형 언어 모델에서 가장 중요한 계산상의 과제 중 하나를 해결합니다. 이 메커니즘은 긴 텍스트 시퀀스에서 관련된 부분만 선택적으로 처리함으로써 효율성을 높입니다. 기존의 주의력 메커니즘(attention mechanism)은 모든 토큰 간의 관계를 계산해야 하며, 이는 시퀀스가 길어질수록 계산 복잡도가 제곱으로 증가하여 매우 비싸집니다.


DeepSeek가 구현한 방식은 ‘라이트닝 인덱서(lightning indexer)’라고 불리는 도구를 사용하여 토큰의 중요도를 점수화하고 순위를 매깁니다. 각 쿼리에 가장 관련성이 높은 연결만 유지하는 방식으로, 불필요한 계산을 줄입니다. 이 선택적 접근법을 통해 최대 128,000 토큰의 긴 시퀀스도 처리할 수 있으며, 출력 품질은 완전한 주의력 메커니즘과 거의 동일하게 유지됩니다.


이 모델은 즉시 DeepSeek의 앱, 웹 플랫폼 및 API 서비스를 통해 이용 가능하며, 오픈소스는 Hugging Face 및 GitHub 저장소를 통해 제공됩니다. 또한, 회사는 다양한 하드웨어 환경에서 연구와 배포를 용이하게 하기 위해 TileLang과 CUDA 형식의 GPU 커널도 공개했습니다.

이번 발표는 글로벌 AI 경쟁이 격화되는 가운데 이루어졌습니다. 특히 중국 기업들이 인공지능 개발 분야에서 미국의 우위를 정면으로 도전하고 있습니다. 최근 분석에 따르면, 중국 기업들은 독자적인 AI 개발 경로를 구축하여 비용 효율성과 빠른 배치를 극대화함으로써 서방 경쟁사들을 이미 따라잡거나 앞서가고 있는 것으로 나타났습니다.

댓글 0
전체 1,129 / 216 페이지
(퍼플렉시티가 정리한 기사)소매 투자자들이 주식 선정을 위해 인공지능 챗봇을 점점 더 많이 활용하면서, 로보어드바이저 시장이 폭발적으로 성장해 2029년에는 업계 분석가들이 예측한 4,709억 1천만 달러의 수익을 기록할 것으로 예상되고 있습니다. 이는 지난해의 617억 5천만 달러에서 600% 이상의 급증입니다.ChatGPT가 오는 11월 세 번째 생일을 앞두고 있는 가운데, 이미 최소 13%의 소매 투자자들이 이 인기 챗봇을 주식 선정에 활용하고 있으며, 추가로 50%는 투자 결정을 위해 AI 도구 사용을 고려할 것이라고 11,000명의 글로벌 소매 투자자를 대상으로 한 증권사 eToro의 조사 결과 밝혀졌습니다. 이 현상은 한때 대형 금융기관과 전문 투자자에게만 한정되었던 투자 분석을 대중화시켰습니다.전직 월스트리트 애널리스트들이 AI 도입을 주도하다스위스 은행 UBS에서 거의 20년 동안 기업을 분석해온 Jeremy Leung은 올해 초 직장을 잃은 후 이러한 경향을 대표하고 있습니다. 비싼 블룸버그 단말기나 프리미엄 시장 데이터 서비스에 접근할 수 없게 된 Leung은 이제 그의 멀티-자산 투자 포트폴리오 관리를 위해 ChatGPT를 활용하고 있습니다.“심지어 단순한 ChatGPT 도구만으로도 많은 일을 할 수 있고, 내가 이전에 했던 워크플로우를 상당 부분 복제할 수 있다”고 Leung은 말했으나, 이런 도구들이 유료 서비스 뒤에 있는 데이터에 접근하지 못해 중요한 분석을 놓칠 수 있다는 점을 경고했습니다.ChatGPT의 효과를 극대화하기 위해 Leung은 “당신이 숏 분석가라고 가정하고, 이 종목의 숏 투자 논거를 제시하라”와 같이 구체적인 프롬프트를 만들고, “SEC 공시와 같은 신뢰할 수 있는 소스만 사용하라”고 AI에게 지시합니다. 이러한 접근은 테크놀로지의 한계를 이해하는 AI 보조 투자자들 사이에서 점점 정교해지고 있는 트렌드를 반영합니다.AI 포트폴리오가 전통적인 펀드보다 더 높은 성과를 기록하다실질적인 결과는 눈에 띄게 나타났습니다. 비교 조사 업체 Finder가 2023년 3월 ChatGPT에 부채 수준, 지속적인 성장, 경쟁 우위 등 기준에 따라 우량 기업의 주식을 선별하도록 요청했을 때, 이렇게 선정된 38종목 포트폴리오의 수익률은 거의 55%에 달했습니다. 이 포트폴리오에는 AI 선두주자인 엔비디아 , 전자상거래 대기업 아마존 , 그리고 프로터 & 갬블 , 월마트 와 같은 필수소비재 기업이 포함되어 있으며, 영국에서 가장 인기 있는 10대 펀드의 평균 수익률을 거의 19%포인트 웃돌았습니다.이러한 성공은 미국 증시가 사상 최고치 부근을 맴도는 가운데, S&P 500 지수는 2024년에 23% 급등한 데 이어 올해도 13% 상승한 상황에서 이루어졌습니다. 그러나 전문가들은 이러한 성과가 모든 시장 상황에서 지속되지 않을 수 있다고 경고합니다.업계의 고위험 전략 경고인상적인 결과에도 불구하고, 금융업계 전문가들은 AI 기반 주식 선별이 상당한 위험을 수반한다고 경고한다. 전 세계적으로 3,000만 명의 사용자를 보유한 eToro의 영국 지사장 댄 모츨스키(Dan Moczulski)는 “ChatGPT나 Gemini 같은 범용 모델을 마치 예언 도구처럼 여길 때 위험이 발생한다”고 경고한다.모츨스키는 시장 분석을 위해 특별히 훈련된 AI 플랫폼의 사용을 옹호하며, “일반적인 AI 모델은 수치와 날짜를 잘못 인용하거나, 지나치게 미리 정해진 내러티브에 의존하며, 과거 가격 동향에 지나치게 의지해 미래를 예측하려 할 수 있다”고 지적한다.ChatGPT 자체도 사용자에게 전문적인 금융 조언에 의존하지 말라고 경고하며, 모기업인 OpenAI 또한 얼마나 많은 사람들이 투자 결정을 위해 챗봇을 사용하는지에 대한 데이터를 공개하지 않았다. AI 도구에 대한 열광은 일반 투자자들이 시장 하락 시 잠재적 손실을 방지하기 위한 적절한 리스크 관리 전략을 구사하고 있는지에 대한 우려를 낳고 있다.
1172 조회
0 추천
2025.09.25 등록
(퍼플렉시티가 정리한 기사)스포티파이 는 목요일에 인공지능 음악 정책에 대한 대대적인 변화를 발표하며, 딥페이크와 스팸을 막기 위한 새로운 안전장치를 도입했다고 밝혔습니다. 또한 지난 1년 동안 플랫폼에서 7천5백만 개가 넘는 문제 있는 트랙을 삭제했다고 공개했습니다. 이 스트리밍 대기업의 세 가지 전략은 AI 기반 사기와 맞서면서도 기술의 정당한 예술적 활용을 지원하는 데 목적이 있으며, AI 생성 콘텐츠가 음악 플랫폼을 급격히 증가하는 상황에 대한 스포티파이의 가장 포괄적인 대응을 의미합니다.새로운 기준이 AI 투명성과 스팸을 겨냥하다회사는 DDEX(Digital Data Exchange)가 개발한 AI 음악 공개를 위한 새로운 업계 표준을 도입할 예정이며, 이를 통해 아티스트와 레이블이 창작 과정에서 인공지능이 어떻게 사용되었는지 정확하게 명시할 수 있습니다. 이 시스템 하에서는 크리에이터가 AI가 보컬을 생성했는지, 악기를 연주했는지, 또는 후반 작업을 처리했는지 여부를 나타낼 수 있어, 단순한 “AI 여부” 구분을 넘어서게 됩니다.Spotify의 글로벌 마케팅 및 정책 총괄인 샘 두보프(Sam Duboff)는 언론 브리핑에서 “AI의 활용은 하나의 스펙트럼이 될 것이며, 아티스트와 프로듀서들은 창작 프로세스의 여러 부분에서 AI를 결합하게 될 것입니다”라고 말했습니다. “이 업계 표준은 보다 정확하고 세밀한 공개를 가능하게 합니다.”Spotify는 또한 올가을 대량 업로드, 중복 트랙, SEO 조작, 로열티 지급을 노린 인위적으로 짧은 곡 등 음악 스팸을 겨냥한 강화된 필터를 도입할 예정입니다. 해당 필터는 문제 upload자를 식별하여 이들의 트랙을 알고리즘 추천에서 제거하지만, 완전히 삭제하지는 않을 예정입니다.AI 음악 논란에 따른 강경 조치정책 개편은 제대로 된 공개 없이 AI가 생성한 아티스트들이 엄청난 성공을 거두며 논란이 커지는 것에 대한 대응으로 이루어졌다. 완전히 AI로 만들어진 것이 확인되기 전까지 스포티파이에서 월 100만 명 이상의 청취자를 모은 ‘벨벳 선다운’은 플랫폼의 투명성 문제를 보여주는 대표적인 사례였다. 이 밴드의 곡들은 인기 플레이리스트와 사용자들의 ‘Discover Weekly’ 추천곡에 등장했으나, AI로 생성된 프로필 사진과 가짜 밴드 멤버 약력 등 불분명한 부분을 레딧 이용자들이 지적하기도 했다.스포티파이 경영진은 플랫폼이 고의로 AI 생성 콘텐츠를 홍보해 저작권료 지급을 줄이려 한다는 지속적인 소문에 대해 직접 해명했다. 정책 브리핑에서 샘 두보프는 “그런 소문들은 단호하게, 그리고 완전히 사실이 아닙니다”라고 밝혔다. “스포티파이는 어떤 음악도 직접 생성하지 않습니다. 저희가 음악을 소유하지도 않습니다. 스포티파이에 있는 모든 음악, 100%는 라이선스를 받은 제3자가 만든 것이고, 업로드한 것입니다.” 회사는 정당한 AI 활용은 지지하는 한편, 노스캐롤라이나의 뮤지션이 AI를 이용해 ‘수십만 곡’을 만들어 1천만 달러 이상 부정 스트리밍 로열티를 챙긴 사례 등과 같은 사기에는 강력하게 대응할 것임을 강조했다.
1146 조회
0 추천
2025.09.25 등록
(퍼플렉시티가 정리한 기사)SK텔레콤 이 AI 사업을 총괄하는 사내회사(CIC) 출범을 발표하며 2030년 연매출 5조원 달성을 목표로 5년간 5조원을 투자한다고 밝혔다. 유영상 CEO가 25일 전 구성원 대상 타운홀 미팅을 열고 이같은 내용을 발표했다.AI CIC 조직 체계와 목표AI CIC는 에이닷(A.) 서비스, 기업용 에이닷 비즈, AI 데이터센터 사업, 글로벌 AI 제휴투자, AI R&D, 메시징·인증 사업 등 전사 AI 관련 기능과 조직을 통합해 운영된다. 유영상 CEO가 직접 AI CIC 대표를 겸임하며, 세부 조직 개편은 10월 말 시행될 예정이다.유 CEO는 “급변하는 AI 환경 변화에 따라 위기와 기회가 공존하는 AI 골든타임을 놓치지 않기 위해서는 수요자 관점의 내부 AI 혁신과 공급자 관점의 AI 사업 혁신이 필요하다”며 AI CIC 출범 배경을 설명했다.사업 전략과 성과 기반AI CIC는 AI 수요(B2C, B2B)와 공급(AI 인프라)의 안정적 선순환을 통해 독자 생존 가능한 수익 구조를 확보할 계획이다. B2C는 에이닷을 중심으로 국내외 가입자 기반을 확대하고, B2B는 에이전틱 AI 서비스를 통한 생산성 향상 입증과 제조 AI 분야 레퍼런스 확보에 집중한다.SK텔레콤은 지난 3년간 AI 컴퍼니 전환을 통해 에이닷 1000만 가입자 확보, 독자 AI 파운데이션 모델 선정, 울산 AI DC 착수, 글로벌 파트너십 구축 등의 성과를 달성했다고 발표했다. 에이닷은 정식 출시 22개월 만에 가입자 1000만명을 돌파했으며, 월간 활성사용자수(MAU)는 약 810만명에 달한다.울산 AI 데이터센터의 경우 7조원을 투자해 축구장 11개 규모의 연면적 2만평 이상으로 건설되며, 6만장 가량의 GPU를 수용할 수 있는 국내 최대 규모의 AI 전용 하이퍼스케일 데이터센터로 2027년 말부터 단계적 가동을 시작할 예정이다.
1195 조회
0 추천
2025.09.25 등록
(퍼플렉시티가 정리한 기사)삼성전자 가 자체 개발한 AI 업무 생산성 측정 지표 ’트루벤치(TRUEBench)’를 25일 공개하며, 기존 영어 중심 벤치마크의 한계를 극복한 실무 환경 기반 평가 도구를 선보였다.실무 환경 반영한 차별화된 평가 지표트루벤치는 삼성전자 DX부문 선행 연구개발조직인 삼성리서치가 사내 생성형 AI 모델 적용 경험을 바탕으로 개발한 벤치마크다. 기존 AI 벤치마크 대부분이 영어 중심이고 한 번 또는 제한된 횟수의 대화만을 평가해 실제 업무 생산성 성능을 정확히 측정하기 어렵다는 문제를 해결하기 위해 만들어졌다.실제 평가 항목은 10개 카테고리, 46개 업무, 2,485개의 세분화된 항목으로 구성됐다. 콘텐츠 생성, 데이터 분석, 문서 요약 및 번역, 연속 대화 등 기업에서 자주 사용하는 실제 오피스 업무 체크리스트를 기반으로 완성됐다. 사용자의 짧은 요청부터 최대 2만자의 긴 문서 요약까지 실제 업무 상황을 폭넓게 평가한다.다국어 지원과 글로벌 접근성트루벤치는 영어, 한국어, 일본어, 중국어, 스페인어 등 총 12개 언어를 지원한다. 특히 글로벌 비즈니스 환경을 고려해 영어와 한국어 등 여러 언어가 혼합된 교차 언어의 번역 기능 평가도 가능하다. 사용자는 한 번에 최대 5개 모델을 선택해 비교할 수 있어 다양한 AI 모델의 성능을 한눈에 파악할 수 있으며, 응답 결과에 대한 평균 길이 등도 공개해 성능과 효율성 지표를 동시에 비교할 수 있다.삼성전자는 글로벌 오픈소스 플랫폼 허깅페이스(Hugging Face)에 트루벤치의 데이터 샘플과 AI 모델들의 평가 결과가 표시된 리더보드를 공개했다.AI 교차 검증으로 객관성 확보트루벤치는 답변의 정확성뿐만 아니라, 겉으로 드러나지 않는 사용자의 의도나 맥락까지 평가가 가능하도록 설계됐다. 평가 항목 검증에는 AI가 활용되는데, 사람이 구축한 평가 기준을 AI가 검토해 오류나 모순, 불필요한 제약이 없는지 확인하며 지속적인 교차 검증의 반복을 통해 더욱 정교한 평가 기준을 완성한다. 이러한 기준으로 완성된 AI 모델 자동 평가는 주관적 편향을 최소화하고 일관성 있는 결과를 제공한다.전경훈 DX부문 최고기술책임자(CTO) 겸 삼성리서치장 사장은 “삼성 리서치는 다양한 실제 적용 사례를 바탕으로 차별화된 생산성 AI 기술 경쟁력과 노하우를 보유하고 있다”며 “트루벤치 공개를 통해 생산성 성능 평가 기준을 정립하고 삼성전자의 기술 리더십을 더욱 공고히 할 것”이라고 말했다.
1192 조회
0 추천
2025.09.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입