Loading...

AI 뉴스

DeepSeek, AI 비용을 절반으로 줄이는 모델 출시

페이지 정보

작성자 xtalfi
작성일 2025.09.30 04:29
2,882 조회
0 추천
0 비추천

본문

fcf479c22f7f91e4f33ec4d7f1408300VRSE.png

(퍼플렉시티가 정리한 기사)

중국 AI 개발사 딥시크(DeepSeek)는 2025년 9월 29일, 혁신적인 희소 주의(sparse attention) 기술을 도입한 실험적 V3.2-Exp 모델을 출시했습니다. 이 기술은 최상급 AI 시스템에 견줄만한 성능을 유지하면서도 컴퓨팅 비용을 획기적으로 줄였습니다. 이번 출시로 항저우에 기반을 둔 딥시크는 오픈AI(OpenAI)와 같은 글로벌 기업은 물론, 알리바바 그룹 홀딩 리미티드의 Qwen 플랫폼을 포함한 국내 경쟁사들과의 AI 경쟁에서 강력한 경쟁자로 부상했습니다.


V3.2-Exp 모델은 딥시크 희소 주의(DeepSeek Sparse Attention, DSA)을 처음으로 선보였으며, 이는 “처음으로 미세하게 조정된 희소 주의(fine-grained sparse attention)를 달성했다”고 개발자 플랫폼 허깅페이스(Hugging Face)에 발표했습니다. 이 기술로 인해 모델은 기존 방식보다 최대 64배 빠르게 긴 텍스트 시퀀스를 처리할 수 있으며, 메모리 사용량도 30~40% 절감되고 훈련 효율성은 약 50% 향상되었습니다.

 

시장 교란을 일으키는 가격 인하, 경쟁 압박 신호


DeepSeek는 API 가격을 50% 이상 인하했다고 발표했으며, 캐시 히트 시 입력 비용은 백만 토큰당 $0.07까지, 캐시 미스 시에는 백만 토큰당 $0.56까지 낮아졌습니다. 이러한 극적인 가격 인하는 2025년 1월 R1 모델 출시 당시 엔비디아 등 기존 AI 선두 기업에 위협이 될 것을 우려한 투자자들로 인해 6,000억 달러 규모의 주식 시장 매도 사태가 발생했던 회사의 과거 시장 교란을 떠올리게 합니다.


이 회사는 V3.2-Exp를 “차세대 아키텍처로 가는 중간 단계”라고 설명했으며, 이는 V3.1-Terminus 기반 위에 구축되었습니다. 추론, 코딩, 수학적 문제 해결 등 다양한 분야의 벤치마크 테스트에서 새로운 모델은 전작과 동등한 성능을 보이면서도 상당한 효율성 향상을 제공했습니다. 프로그래밍 챌린지에서 V3.2-Exp는 Codeforces 벤치마크 기준 V3.1-Terminus가 기록한 2,046점 대비 2,121점을 획득했습니다.

 

스파스 어텐션 기술이 핵심 AI 효율성 문제를 해결합니다


혁신적인 희소 주의력 메커니즘(sparse attention mechanism)은 대형 언어 모델에서 가장 중요한 계산상의 과제 중 하나를 해결합니다. 이 메커니즘은 긴 텍스트 시퀀스에서 관련된 부분만 선택적으로 처리함으로써 효율성을 높입니다. 기존의 주의력 메커니즘(attention mechanism)은 모든 토큰 간의 관계를 계산해야 하며, 이는 시퀀스가 길어질수록 계산 복잡도가 제곱으로 증가하여 매우 비싸집니다.


DeepSeek가 구현한 방식은 ‘라이트닝 인덱서(lightning indexer)’라고 불리는 도구를 사용하여 토큰의 중요도를 점수화하고 순위를 매깁니다. 각 쿼리에 가장 관련성이 높은 연결만 유지하는 방식으로, 불필요한 계산을 줄입니다. 이 선택적 접근법을 통해 최대 128,000 토큰의 긴 시퀀스도 처리할 수 있으며, 출력 품질은 완전한 주의력 메커니즘과 거의 동일하게 유지됩니다.


이 모델은 즉시 DeepSeek의 앱, 웹 플랫폼 및 API 서비스를 통해 이용 가능하며, 오픈소스는 Hugging Face 및 GitHub 저장소를 통해 제공됩니다. 또한, 회사는 다양한 하드웨어 환경에서 연구와 배포를 용이하게 하기 위해 TileLang과 CUDA 형식의 GPU 커널도 공개했습니다.

이번 발표는 글로벌 AI 경쟁이 격화되는 가운데 이루어졌습니다. 특히 중국 기업들이 인공지능 개발 분야에서 미국의 우위를 정면으로 도전하고 있습니다. 최근 분석에 따르면, 중국 기업들은 독자적인 AI 개발 경로를 구축하여 비용 효율성과 빠른 배치를 극대화함으로써 서방 경쟁사들을 이미 따라잡거나 앞서가고 있는 것으로 나타났습니다.

댓글 0
전체 1,366 / 296 페이지
Perplexity가 " 이메일 어시스턴트"를 퍼플렉시티 Max 유료 구독자에게 제공한다.지메일과 아웃룩용 AI 에이전트에 연동하는 것으로 사용자의 목소리와 맞춰 답장 초안을 만들어준다. 또한 이메일에 자동으로 라벨을 붙여 받은 편지함을 정리해주고, cc를 추가하면 미팅 시간을 제안해준다고.이 서비스는 구글 및 마이크로소프트 계정과의 연동으로 작동한다. 퍼플렉시티는 사용자 데이터를 모델 훈련에 사용하지 않는다고 하며, 비슷한 기능으로 구글 제미나이나 MS 코파일럿에서 이미 제공한 바 있다.하지만 요즘 주목을 받는 '에이전트' 기능으로 이메일 스레드 내에서 일정 조율의 전 과정을 처리한다는 점이 특징이라고.자세한 내용은 아래 페이지에서 확인할 수 있다.https://www.perplexity.ai/assistant
2996 조회
0 추천
2025.09.26 등록
페이스북 데이팅 기능이 스와이핑으로 파트너를 찾는 피로함을 해결하기 위해 AI 를 도입한다고 밝혔다.페이스북은 "데이트 어시스턴트"와 "밋 큐트(Meet Cute)"라는 두 가지 새로운 기능을 자사의데이팅 서비스에 도입해, 반복적인 스와이프 방식에 지친 사용자들을 돕고자 한다고 발표했다데이트 어시스턴트는 사용자의 취향과 관심사를 바탕으로 맞춤형 추천을 제공하는 채팅 기반 도우미로,전통적인 키, 교육 수준 등의 기준뿐 아니라 '브루클린에 사는 IT 업계 여성 찾아줘'처럼 구체적인 요청도 가능하다이 어시스턴트는 매칭 탭에서 이용할 수 있으며, 미국과 캐나다에서 순차적으로 도입될 예정이다밋 큐트는 사용자의 선호도에 따라 매주 자동으로 새로운 상대와 매칭해주는 기능으로, 매칭된 상대와 대화를 나누거나 필요시 매칭을 해제할 수 있다페이스북은 이러한 기능들이 반복적인 스와이프로 인해 피로감을 느끼던 사용자들에게 새로운 만남의 기회를 제공하고, 쉽고 재미있는 만남을 이어갈 수 있도록 서비스를 계속 개선해 나가겠다고 밝혔다.
2976 조회
0 추천
2025.09.26 등록
(퍼플렉시티가 정리한 기사)구글 딥마인드 는 화요일에 자사의 가장 진보된 AI 로봇 모델을 공개했으며, 이러한 시스템은 복잡한 작업을 실행하기 전에 “생각”을 할 수 있고 문제 해결을 위해 실시간 정보 검색까지 할 수 있습니다.새로운 두 모델인 Gemini Robotics 1.5와 Gemini Robotics-ER 1.5는, 구글 딥마인드 로보틱스 책임자인 Carolina Parada에 따르면, 광범위한 재프로그래밍 없이 새로운 환경에 적응할 수 있는 다재다능한 로봇을 만드는 데 있어 상당한 진전을 보여줍니다.행동하기 전에 생각하는 로봇들이번 혁신은 Gemini Robotics-ER 1.5에 초점을 맞추고 있으며, DeepMind는 이를 현대의 텍스트 기반 챗봇과 유사한 시뮬레이션 추론이 가능한 최초의 로봇 AI라고 설명합니다. “ER”은 “구체적 추론(embodied reasoning)“을 의미하며, 이를 통해 로봇이 물리적 행동을 실행하기 전에 여러 단계를 미리 계획할 수 있습니다.시연 동안 연구원들은 로봇에게 “현지 규정에 따라” 쓰레기를 분류하라는 요청을 하고, 로봇이 재활용품을 성공적으로 분류하는 모습을 보여주었습니다. 로봇은 연구원이 샌프란시스코에 있다는 사실을 파악하고, 온라인에서 현지 재활용 규정을 검색한 후, 올바르게 물품을 분류했습니다. 또 다른 실험에서는 런던 여행을 위해 짐을 싸라는 요청을 받은 후, 로봇이 날씨 예보를 검색하고 비니와 같은 적절한 아이템을 챙기기도 했습니다.“현대 로봇은 매우 특수화되어 있으며 구현이 어려워, 단일 용도의 로봇 한 대를 도입하는 데 수개월이 걸리는 경우가 많다”고 파라다는 밝혔습니다. 새로운 생성형 AI 접근법은 로봇이 재프로그래밍 없이 완전히 새로운 상황을 처리할 수 있게 합니다.행동하기 전에 생각하는 로봇들이번 혁신은 Gemini Robotics-ER 1.5에 초점을 맞추고 있으며, DeepMind는 이를 현대의 텍스트 기반 챗봇과 유사한 시뮬레이션 추론이 가능한 최초의 로봇 AI라고 설명합니다. “ER”은 “구체적 추론(embodied reasoning)“을 의미하며, 이를 통해 로봇이 물리적 행동을 실행하기 전에 여러 단계를 미리 계획할 수 있습니다.시연 동안 연구원들은 로봇에게 “현지 규정에 따라” 쓰레기를 분류하라는 요청을 하고, 로봇이 재활용품을 성공적으로 분류하는 모습을 보여주었습니다. 로봇은 연구원이 샌프란시스코에 있다는 사실을 파악하고, 온라인에서 현지 재활용 규정을 검색한 후, 올바르게 물품을 분류했습니다. 또 다른 실험에서는 런던 여행을 위해 짐을 싸라는 요청을 받은 후, 로봇이 날씨 예보를 검색하고 비니와 같은 적절한 아이템을 챙기기도 했습니다.“현대 로봇은 매우 특수화되어 있으며 구현이 어려워, 단일 용도의 로봇 한 대를 도입하는 데 수개월이 걸리는 경우가 많다”고 파라다는 밝혔습니다. 새로운 생성형 AI 접근법은 로봇이 재프로그래밍 없이 완전히 새로운 상황을 처리할 수 있게 합니다.
2951 조회
0 추천
2025.09.26 등록
(퍼플렉시티가 정리한 기사)일론 머스크의 인공지능 스타트업 xAI는 수요일 캘리포니아 연방법원에 경쟁사인 오픈AI를 상대로 소송을 제기했으며, 오픈AI가 전 xAI 직원을 고용해 Grok 챗봇과 관련된 영업 비밀을 훔치는 “심각하게 우려스러운 패턴”에 관여했다는 주장을 하고 있다. 이번 소송은 머스크와 그가 2015년에 공동 설립한 회사 간의 ongoing한 법적 분쟁에서 최근의 격화된 조치다.소장은 오픈AI가 “xAI의 핵심 기술과 사업 계획에 대한 지식을 가진 인물들을 표적으로 삼고, xAI의 소스 코드와 데이터 센터 개시에 있어서의 운영상 강점 등을 포함하여, 그러한 직원들이 xAI에 대한 비밀 유지 및 기타 의무를 불법적인 수단을 통해 위반하도록 유도했다”고 주장하고 있다.사건의 중심에 선 전직 엔지니어이번 소송은 특히 전 xAI 엔지니어 쉬에천 리(Xuechen Li)의 사례를 강조하고 있습니다. 그는 OpenAI에 합류하기 전에 회사의 전체 Grok 코드베이스를 무단 유출한 혐의를 받고 있습니다. 리는 2024년 스탠포드 대학교에서 컴퓨터 과학 박사 학위를 받았으며, xAI의 첫 20명의 엔지니어 중 한 명으로 Grok 챗봇 개발에 직접 참여했습니다.법원 문서에 따르면 리는 2025년 7월 OpenAI에 직위를 수락한 직후 약 700만 달러 상당의 xAI 주식을 매도했습니다. 2025년 7월 25일, 마지막 주식 매각 대금 220만 달러를 수령한 바로 그날, 리는 회사에서 지급한 노트북에서 개인 시스템으로 기밀 정보를 “고의적이고 악의적으로” 복사한 혐의를 받고 있습니다. 그는 3일 뒤 사직했으며, 8월 19일에 OpenAI에서 근무를 시작할 예정이었습니다.연방 판사는 9월 2일 임시 금지 명령을 내려, xAI가 모든 기밀 정보가 반환되었거나 삭제되었음을 확인할 때까지 리가 OpenAI에서 생성형 AI 프로젝트에 참여하는 것을 금지시켰습니다. 해당 명령은 리가 OpenAI 직원과 생성형 AI에 관해 논의하는 것도 제한합니다.더욱 치열해진 AI 인재 전쟁이 사건은 실리콘 밸리에서 특히 중국계 전문가들 사이에서 치열한 경쟁이 벌어지고 있는 엘리트 AI 엔지니어 인재 확보전을 강조한다. xAI에는 유화이 토니 우(Yuhuai Tony Wu)를 비롯해 여러 저명한 중국계 엔지니어들이 핵심 역할을 맡고 있는데, 그는 머스크와 함께 Grok 제품 출시 행사에 자주 등장한다.이번 소송은 머스크가 오픈AI(OpenAI)와 벌이고 있는 지속적인 법적 분쟁에 추가되는 것으로, 8월에 오픈AI와 애플를 상대로 제기된 별도의 반독점 소송도 포함된다. AI 챗봇 시장에서의 독점 행위가 주장되고 있다. 오픈AI는 머스크에게 괴롭힘 혐의로 역소송을 제기했다. 오픈AI와 두 회사의 대변인은 이번 최신 사건에 대한 논평 요청에 즉각적으로 답변하지 않았다.
2960 조회
0 추천
2025.09.26 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입