Loading...

AI 뉴스

DeepSeek, AI 비용을 절반으로 줄이는 모델 출시

페이지 정보

작성자 xtalfi
작성일 2025.09.30 04:29
1,199 조회
0 추천
0 비추천

본문

fcf479c22f7f91e4f33ec4d7f1408300VRSE.png

(퍼플렉시티가 정리한 기사)

중국 AI 개발사 딥시크(DeepSeek)는 2025년 9월 29일, 혁신적인 희소 주의(sparse attention) 기술을 도입한 실험적 V3.2-Exp 모델을 출시했습니다. 이 기술은 최상급 AI 시스템에 견줄만한 성능을 유지하면서도 컴퓨팅 비용을 획기적으로 줄였습니다. 이번 출시로 항저우에 기반을 둔 딥시크는 오픈AI(OpenAI)와 같은 글로벌 기업은 물론, 알리바바 그룹 홀딩 리미티드의 Qwen 플랫폼을 포함한 국내 경쟁사들과의 AI 경쟁에서 강력한 경쟁자로 부상했습니다.


V3.2-Exp 모델은 딥시크 희소 주의(DeepSeek Sparse Attention, DSA)을 처음으로 선보였으며, 이는 “처음으로 미세하게 조정된 희소 주의(fine-grained sparse attention)를 달성했다”고 개발자 플랫폼 허깅페이스(Hugging Face)에 발표했습니다. 이 기술로 인해 모델은 기존 방식보다 최대 64배 빠르게 긴 텍스트 시퀀스를 처리할 수 있으며, 메모리 사용량도 30~40% 절감되고 훈련 효율성은 약 50% 향상되었습니다.

 

시장 교란을 일으키는 가격 인하, 경쟁 압박 신호


DeepSeek는 API 가격을 50% 이상 인하했다고 발표했으며, 캐시 히트 시 입력 비용은 백만 토큰당 $0.07까지, 캐시 미스 시에는 백만 토큰당 $0.56까지 낮아졌습니다. 이러한 극적인 가격 인하는 2025년 1월 R1 모델 출시 당시 엔비디아 등 기존 AI 선두 기업에 위협이 될 것을 우려한 투자자들로 인해 6,000억 달러 규모의 주식 시장 매도 사태가 발생했던 회사의 과거 시장 교란을 떠올리게 합니다.


이 회사는 V3.2-Exp를 “차세대 아키텍처로 가는 중간 단계”라고 설명했으며, 이는 V3.1-Terminus 기반 위에 구축되었습니다. 추론, 코딩, 수학적 문제 해결 등 다양한 분야의 벤치마크 테스트에서 새로운 모델은 전작과 동등한 성능을 보이면서도 상당한 효율성 향상을 제공했습니다. 프로그래밍 챌린지에서 V3.2-Exp는 Codeforces 벤치마크 기준 V3.1-Terminus가 기록한 2,046점 대비 2,121점을 획득했습니다.

 

스파스 어텐션 기술이 핵심 AI 효율성 문제를 해결합니다


혁신적인 희소 주의력 메커니즘(sparse attention mechanism)은 대형 언어 모델에서 가장 중요한 계산상의 과제 중 하나를 해결합니다. 이 메커니즘은 긴 텍스트 시퀀스에서 관련된 부분만 선택적으로 처리함으로써 효율성을 높입니다. 기존의 주의력 메커니즘(attention mechanism)은 모든 토큰 간의 관계를 계산해야 하며, 이는 시퀀스가 길어질수록 계산 복잡도가 제곱으로 증가하여 매우 비싸집니다.


DeepSeek가 구현한 방식은 ‘라이트닝 인덱서(lightning indexer)’라고 불리는 도구를 사용하여 토큰의 중요도를 점수화하고 순위를 매깁니다. 각 쿼리에 가장 관련성이 높은 연결만 유지하는 방식으로, 불필요한 계산을 줄입니다. 이 선택적 접근법을 통해 최대 128,000 토큰의 긴 시퀀스도 처리할 수 있으며, 출력 품질은 완전한 주의력 메커니즘과 거의 동일하게 유지됩니다.


이 모델은 즉시 DeepSeek의 앱, 웹 플랫폼 및 API 서비스를 통해 이용 가능하며, 오픈소스는 Hugging Face 및 GitHub 저장소를 통해 제공됩니다. 또한, 회사는 다양한 하드웨어 환경에서 연구와 배포를 용이하게 하기 위해 TileLang과 CUDA 형식의 GPU 커널도 공개했습니다.

이번 발표는 글로벌 AI 경쟁이 격화되는 가운데 이루어졌습니다. 특히 중국 기업들이 인공지능 개발 분야에서 미국의 우위를 정면으로 도전하고 있습니다. 최근 분석에 따르면, 중국 기업들은 독자적인 AI 개발 경로를 구축하여 비용 효율성과 빠른 배치를 극대화함으로써 서방 경쟁사들을 이미 따라잡거나 앞서가고 있는 것으로 나타났습니다.

댓글 0
전체 1,203 / 235 페이지
(퍼플렉시티가 정리한 기사)SK텔레콤 이 AI 사업을 총괄하는 사내회사(CIC) 출범을 발표하며 2030년 연매출 5조원 달성을 목표로 5년간 5조원을 투자한다고 밝혔다. 유영상 CEO가 25일 전 구성원 대상 타운홀 미팅을 열고 이같은 내용을 발표했다.AI CIC 조직 체계와 목표AI CIC는 에이닷(A.) 서비스, 기업용 에이닷 비즈, AI 데이터센터 사업, 글로벌 AI 제휴투자, AI R&D, 메시징·인증 사업 등 전사 AI 관련 기능과 조직을 통합해 운영된다. 유영상 CEO가 직접 AI CIC 대표를 겸임하며, 세부 조직 개편은 10월 말 시행될 예정이다.유 CEO는 “급변하는 AI 환경 변화에 따라 위기와 기회가 공존하는 AI 골든타임을 놓치지 않기 위해서는 수요자 관점의 내부 AI 혁신과 공급자 관점의 AI 사업 혁신이 필요하다”며 AI CIC 출범 배경을 설명했다.사업 전략과 성과 기반AI CIC는 AI 수요(B2C, B2B)와 공급(AI 인프라)의 안정적 선순환을 통해 독자 생존 가능한 수익 구조를 확보할 계획이다. B2C는 에이닷을 중심으로 국내외 가입자 기반을 확대하고, B2B는 에이전틱 AI 서비스를 통한 생산성 향상 입증과 제조 AI 분야 레퍼런스 확보에 집중한다.SK텔레콤은 지난 3년간 AI 컴퍼니 전환을 통해 에이닷 1000만 가입자 확보, 독자 AI 파운데이션 모델 선정, 울산 AI DC 착수, 글로벌 파트너십 구축 등의 성과를 달성했다고 발표했다. 에이닷은 정식 출시 22개월 만에 가입자 1000만명을 돌파했으며, 월간 활성사용자수(MAU)는 약 810만명에 달한다.울산 AI 데이터센터의 경우 7조원을 투자해 축구장 11개 규모의 연면적 2만평 이상으로 건설되며, 6만장 가량의 GPU를 수용할 수 있는 국내 최대 규모의 AI 전용 하이퍼스케일 데이터센터로 2027년 말부터 단계적 가동을 시작할 예정이다.
1347 조회
0 추천
2025.09.25 등록
(퍼플렉시티가 정리한 기사)삼성전자 가 자체 개발한 AI 업무 생산성 측정 지표 ’트루벤치(TRUEBench)’를 25일 공개하며, 기존 영어 중심 벤치마크의 한계를 극복한 실무 환경 기반 평가 도구를 선보였다.실무 환경 반영한 차별화된 평가 지표트루벤치는 삼성전자 DX부문 선행 연구개발조직인 삼성리서치가 사내 생성형 AI 모델 적용 경험을 바탕으로 개발한 벤치마크다. 기존 AI 벤치마크 대부분이 영어 중심이고 한 번 또는 제한된 횟수의 대화만을 평가해 실제 업무 생산성 성능을 정확히 측정하기 어렵다는 문제를 해결하기 위해 만들어졌다.실제 평가 항목은 10개 카테고리, 46개 업무, 2,485개의 세분화된 항목으로 구성됐다. 콘텐츠 생성, 데이터 분석, 문서 요약 및 번역, 연속 대화 등 기업에서 자주 사용하는 실제 오피스 업무 체크리스트를 기반으로 완성됐다. 사용자의 짧은 요청부터 최대 2만자의 긴 문서 요약까지 실제 업무 상황을 폭넓게 평가한다.다국어 지원과 글로벌 접근성트루벤치는 영어, 한국어, 일본어, 중국어, 스페인어 등 총 12개 언어를 지원한다. 특히 글로벌 비즈니스 환경을 고려해 영어와 한국어 등 여러 언어가 혼합된 교차 언어의 번역 기능 평가도 가능하다. 사용자는 한 번에 최대 5개 모델을 선택해 비교할 수 있어 다양한 AI 모델의 성능을 한눈에 파악할 수 있으며, 응답 결과에 대한 평균 길이 등도 공개해 성능과 효율성 지표를 동시에 비교할 수 있다.삼성전자는 글로벌 오픈소스 플랫폼 허깅페이스(Hugging Face)에 트루벤치의 데이터 샘플과 AI 모델들의 평가 결과가 표시된 리더보드를 공개했다.AI 교차 검증으로 객관성 확보트루벤치는 답변의 정확성뿐만 아니라, 겉으로 드러나지 않는 사용자의 의도나 맥락까지 평가가 가능하도록 설계됐다. 평가 항목 검증에는 AI가 활용되는데, 사람이 구축한 평가 기준을 AI가 검토해 오류나 모순, 불필요한 제약이 없는지 확인하며 지속적인 교차 검증의 반복을 통해 더욱 정교한 평가 기준을 완성한다. 이러한 기준으로 완성된 AI 모델 자동 평가는 주관적 편향을 최소화하고 일관성 있는 결과를 제공한다.전경훈 DX부문 최고기술책임자(CTO) 겸 삼성리서치장 사장은 “삼성 리서치는 다양한 실제 적용 사례를 바탕으로 차별화된 생산성 AI 기술 경쟁력과 노하우를 보유하고 있다”며 “트루벤치 공개를 통해 생산성 성능 평가 기준을 정립하고 삼성전자의 기술 리더십을 더욱 공고히 할 것”이라고 말했다.
1357 조회
0 추천
2025.09.25 등록
(퍼플렉시티가 정리한 기사)구글 는 오늘 Mixboard를 공개했습니다. 이 AI 기반 무드보드 애플리케이션은 시각적 영감 도구 분야에서 Pinterest 의 지배력에 직접적으로 도전장을 내밀었습니다. 실험적인 이 서비스는 미국에서 Google Labs를 통해 공개 베타로 제공되며, 사용자는 기존 이미지를 수동으로 선별하는 대신 텍스트 프롬프트를 활용해 시각적 콘셉트 보드를 만들 수 있습니다.Pinterest가 저장된 이미지를 수집 및 정리하는 전통적인 방식을 사용하는 것과 달리, Mixboard는 구글의 화제를 모은 Nano Banana 이미지 편집 모델을 활용해 “보헤미안 거실 인테리어”나 “가을 모임 테마” 같은 간단한 설명만으로도 완전히 새로운 이미지를 생성할 수 있습니다. 이후 사용자는 자연어 명령을 사용하여 이미지를 결합하거나 스타일을 조정하거나, 한 번의 클릭만으로 콘텐츠를 재생성하는 등 AI가 생성한 보드를 더욱 정교하게 다듬을 수 있습니다.구글의 AI 모멘텀, 핀터레스트 영역에 도전하다Mixboard의 출시는 구글의 최근 소비자 AI 도입 붐을 적극적으로 활용한 것입니다. 구글의 Gemini 앱은 Nano Banana 기능에 대한 열풍에 힘입어 9월에 애플 앱스토어와 구글 플레이스토어 모두에서 ChatGPT를 제치고 최고 순위 애플리케이션에 올랐습니다. 구글에 따르면 Nano Banana는 2주 만에 2,300만 명의 신규 사용자를 끌어모았고, 5억 건이 넘는 이미지 편집에 활용되었습니다.이러한 모멘텀 덕분에 Mixboard는 Pinterest의 핵심 비즈니스 모델에 중요한 위협으로 자리매김하고 있습니다. Pinterest가 기존 이미지를 사용자가 직접 발견하고 저장하는 방식으로 플랫폼을 구축한 반면, Mixboard는 AI 생성을 통해 그 큐레이션 과정을 완전히 없앱니다. 이 도구는 홈 데코 계획, 행사 테마, DIY 프로젝트 등과 같이 유사한 활용 사례를 타깃으로 하지만, 사용자가 먼저 이미지 라이브러리를 구축할 필요 없이 즉각적인 시각적 결과를 제공합니다.기술 혁신이 창의적인 워크플로우와 만나다Mixboard는 사용자가 “Nano Banana”라는 별명을 붙인 구글의 Gemini 2.5 Flash Image 모델을 통합하여, 대화형 인터페이스를 통한 정교한 이미지 편집 기능을 제공합니다. 이 플랫폼은 사용자가 개인 이미지를 AI가 생성한 콘텐츠와 함께 업로드할 수 있도록 지원하여, 사용자 자산과 알고리즘이 생성한 시각적 요소가 혼합된 하이브리드 보드를 만들 수 있습니다.이 서비스는 또한 보드 이미지를 기반으로 설명 텍스트를 생성하여, 사용자가 협업자나 클라이언트와 공유할 창의적 개념을 명확히 표현하는 데 도움을 줍니다. 구글은 이 도구가 기존에 물리적 또는 Pinterest 기반의 무드 보드를 활용해 프로젝트를 기획해왔던 사진작가, 디자이너, 크리에이티브 전문가들에게 특히 가치 있는 도구라고 소개합니다.구글은 서비스가 실험 단계(labs.google/mixboard)에 있는 동안 전용 Discord 커뮤니티를 통해 사용자 피드백을 수집하고 있습니다.
1247 조회
0 추천
2025.09.25 등록
(퍼플렉시티가 정리한 기사)이재명 대통령은 수요일, 대한민국 대통령으로는 최초로 유엔 안전보장이사회 회의를 주재함으로써 역사적인 순간을 만들었다. 그는 국제안보에 대한 인공지능의 증대하는 위협에 관한 전례 없는 글로벌 토론을 이끌었다. 뉴욕 유엔 본부에서 열린 공개 토론에는 세계 정상, 인공지능 전문가, 외교관들이 모여 인류가 직면한 가장 시급한 기술적 도전 중 하나를 함께 논의했다.안토니우 구테흐스 유엔 사무총장은 인공지능의 무기화 가능성에 대해 강력한 경고를 전하며, 15개 이사국에게 “최근 분쟁은 인공지능을 활용한 타격과 자율성의 시험장이 되고 있다”고 말했다. 그는 치명적인 자율 무기 시스템에 대한 전 세계적 금지를 재차 촉구하면서 “인류의 운명을 알고리즘에게 맡길 수 없다”며 “생명과 죽음의 결정에서는 인간이 반드시 권한을 유지해야 한다”고 강조했다.대한민국, 글로벌 AI 거버넌스 선도이 대표가 이번 회의를 주재한 것은 9월 한국이 유엔 안보리 의장국을 맡으면서 마련한 대표적 행사였다. 이 대표는 모인 대표들에게 인공지능(AI)이 경제 침체와 기후 변화와 같은 도전을 극복하는 데 인류를 도울 수도 있지만, “‘아이언 커튼’을 뛰어넘는 ‘실리콘 커튼’이 되어 전 세계적으로 불평등과 불균형을 심화시킬 수도 있다”고 경고했다.AI 선구자 제프리 힌턴이 현재의 AI를 “아주 귀여운 호랑이 새끼”로 비유한 것을 인용해, 이 대표는 이 기술이 “우리를 잡아먹는 사나운 포식자가 될 수도 있고, K팝 데몬헌터즈에 나오는 사랑스러운 캐릭터 더피(Derpy)가 될 수도 있다”고 말했다. 그는 “유일하게 현실적이고 현명한 선택은 국익을 위해 경쟁하되, 인류의 이익을 위해 협력하는 것”이라고 강조했다.한국은 국제 AI 거버넌스 노력의 선두에 나서, 네덜란드와 함께 유엔 최초의 군사 AI 관련 결의안을 공동제안하고, AI 서울 서밋을 개최해 ‘안전성, 혁신, 포용성’을 강조하는 서울 선언문을 발표했다. 이 대표는 다음 아시아태평양경제협력체(APEC) 정상회의 의장국으로서, 전 세계적으로 AI가 인류의 번영에 기여하도록 하는 세계적 이니셔티브를 선보이겠다고 밝혔다.국제 협력에 대한 긴급한 요청토론은 인공지능(AI) 역량이 기하급수적으로 확장되고 있는 중요한 시점에서 이루어지고 있습니다. 영국 부총리 데이비드 래미는 위원회에 연설하면서 변화의 속도를 “번개와 같다”고 표현하며, “초지능이 수평선 위에 나타나고 있으며, 우리의 행동을 대신해 운영, 조정, 그리고 행동할 수 있게 될 것”이라고 경고했습니다.전문가 브리핑 중 한 명인 스탠퍼드 대학교의 최예진 교수는 AI 개발이 “소수의 기업과 나라”에 집중되고 있다는 우려를 강조하며, 대표단들에게 “소수만이 AI를 구축하고 그 혜택을 누릴 자원을 가지고 있다면, 우리는 나머지 세계를 문밖에 세워두는 꼴이 된다”고 말했습니다. 그녀는 AI 기술에 대한 접근성을 확대하고, AI 시스템 내 언어적·문화적 다양성을 확보할 것을 촉구했습니다.구테흐스 사무총장은 전 세계적 대응을 위한 네 가지 우선 과제를 제시했습니다: 무기 시스템에 대한 인간의 통제 유지, 일관된 규제 체계 구축, 정보의 진실성 보호, 그리고 부유한 나라와 가난한 나라 사이의 “AI 역량 격차” 해소. 그는 “우리가 AI를 평화, 정의, 인류를 위해 형성할 수 있는 기회의 창이 닫히고 있다”며 즉각적인 행동을 촉구했습니다.안보리 회의는 전 세계적 AI 거버넌스 메커니즘 구축을 위한 유엔의 보다 넓은 노력이 이루어지는 가운데 진행되었습니다. 여기에는 AI 거버넌스에 관한 글로벌 대화의 시작과, AI에 대한 독립적인 국제 과학 위원회 설립이 포함됩니다. 이러한 이니셔티브들은 AI 개발과 배치를 전 세계적으로 규제하기 위한 유엔의 가장 포괄적인 시도를 대표합니다.
1212 조회
0 추천
2025.09.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입