AI 뉴스

DeepSeek, 20배 텍스트 압축 기능을 갖춘 OCR 모델 공개

페이지 정보

작성자 xtalfi
작성일 10.21 17:10
168 조회
0 추천
0 비추천

본문

5071e9f235bead1dc8a1f9a4b1561b65YOpq.png

(퍼플렉시티가 정리한 기사) 

중국 AI 기업 DeepSeek은 월요일에 DeepSeek-OCR을 공개했습니다. 이는 97%의 정확도를 유지하면서 최대 20배의 텍스트 압축을 달성하는 오픈소스 멀티모달 AI 모델로, AI 시스템의 문서 처리 효율성에 있어 중요한 돌파구를 마련했습니다.

 

시각적 텍스트 압축의 획기적 발전


30억 파라미터 비전-언어 모델은 텍스트를 압축을 위한 이미지로 취급하는 혁신적인 접근 방식을 활용하여, AI 시스템이 컴퓨팅 비용의 비례적 증가 없이 방대한 문서를 처리할 수 있도록 합니다. DeepSeek의 기술 논문에 따르면, 이 모델은 원본 정보의 97%를 유지하면서 텍스트를 최대 10배까지 압축할 수 있으며, 20배 압축 비율에서도 유용한 성능을 발휘합니다.


“DeepSeek-OCR을 통해 우리는 비전-텍스트 압축이 다양한 과거 컨텍스트 단계에서 7배에서 20배에 이르는 상당한 토큰 감소를 달성할 수 있음을 입증했으며, 이는 LLM의 긴 컨텍스트 문제를 해결하기 위한 유망한 방향을 제시합니다”라고 항저우에 본사를 둔 이 회사는 밝혔습니다.


이 시스템은 단일 Nvidia  A100 GPU에서 매일 200,000페이지 이상을 처리하며, 각각 8개의 A100을 장착한 20대의 서버를 사용하여 하루 3,300만 페이지에 달하는 처리량을 달성합니다. 이러한 처리 능력은 유사한 작업에 일반적으로 수천 개의 토큰을 필요로 하는 기존 OCR 방법을 훨씬 능가합니다.

 

기술 아키텍처 및 성능


DeepSeek-OCR은 두 가지 핵심 구성 요소로 이루어져 있습니다: 이미지 처리를 위한 DeepEncoder와 디코더로서의 DeepSeek3B-MoE-A570M입니다. 인코더는 Meta의  8천만 매개변수 SAM(Segment Anything Model)과 OpenAI의 3억 매개변수 CLIP을 결합하며, 1,024픽셀 이미지를 4,096개 토큰에서 단 256개 토큰으로 줄이는 16배 압축기를 활용합니다.


OmniDocBench 벤치마크 테스트에서 DeepSeek-OCR은 256개가 아닌 단 100개의 비전 토큰만 사용하여 GOT-OCR 2.0을 능가했으며, 페이지당 6,000개 이상의 토큰 대신 800개 미만의 토큰으로 MinerU 2.0을 초과했습니다. 이 모델은 약 100개 언어를 지원하며, 64개 토큰이 필요한 간단한 프레젠테이션부터 “건담 모드”에서 최대 800개 토큰이 필요한 복잡한 신문까지 다양한 문서 유형을 처리할 수 있습니다.


DeepSeek은 합성 다이어그램, 화학식, 기하학적 도형을 포함하여 약 100개 언어에 걸친 3천만 개의 PDF 페이지를 사용하여 시스템을 훈련했습니다. 이 모델은 현재 MIT 라이선스 하에 Hugging Face와 GitHub에서 이용 가능하며, OpenAI와 Google 의 모델에 대한 비용 효율적인 대안으로 업계를 혁신해 온 DeepSeek의 오픈소스 AI 개발에 대한 약속을 이어가고 있습니다.

댓글 0
전체 583 / 4 페이지
(퍼플렉시티가정리한기사)전세계기업들이정교한AI생성가짜경비영수증의급증으로어려움을겪고있으며,인공지능도구가모든직원에게문서위조를쉽게만들면서사기성청구로인해기업들이수백만달러의손실을입고있습니다.최근데이터에따르면AI생성영수증은현재9월에제출된전체사기성경비문서의14%를차지하며,이는불과1년전0%에서급증한수치입니다.​이러한증가는주요기술기업들이고급이미지생성기능을출시하는것과동시에발생했습니다.경비관리회사들은2025년3월OpenAI가개선된GPT-4o이미지생성기능을출시한이후가짜영수증이극적으로증가했다고보고하고있습니다.​현실적인위조물로인해압도당한탐지시스템핀​테크기업Ramp는새로운탐지소프트웨어를사용하여단90일만에100만달러이상의가짜송장을식별했습니다.한편,경비추적소프트웨어를만드는AppZen은9월에AI로생성된가짜문서가전체사기문서의약14%를차지한다는것을발견했습니다.​매월8천만건이상의규정준수검사를처리하는세계최대경비추적플랫폼중하나인SAPConcur의제품마케팅책임자이자수석부사장인ChrisJuneau는"이러한영수증이너무정교해져서우리는고객들에게'눈을믿지말라'고말합니다"라고밝혔습니다.​경비관리회사Medius의조사에따르면회계사의32%가AI로생성된가짜영수증을인식할수없다고인정했습니다.또한미국과영국의재무전문가중30%가OpenAI가GPT-4o를출시한후가짜영수증이더많아졌다고언급했습니다.​기업에대한광범위한재정적영향경비사기급증은기업재정에영향을미치는더광범위한위기의일부입니다.디지털사기는현재전세계기업들에게연간수익의평균7.7%의비용을초래하며,이는지난1년간약5,340억달러의손실을나타냅니다.미국기업들은수익의평균9.8%로더욱가파른손실에직면해있으며,이는2024년이후46%증가한수치입니다.​딥페이크관련금융손실은2025년에15억6천만달러로폭증했으며,올해만10억달러이상이발생했습니다.연방기관들은AI생성사기위험이2023년123억달러에서2027년까지미국에서400억달러에이를수있다고전망하고있습니다.​기업들이AI와싸우기위해AI를배치하다조직들은메타데이터및기타디지털지문을분석하여합성문서를식별하는AI기반탐지시스템을구현하여대응하고있습니다.그러나사기꾼들은AI로생성된영수증의사진을찍거나스크린샷을촬영하여증거가되는메타데이터를제거함으로써이러한조치를우회할수있습니다.​경비관리플랫폼Rydoo의SebastienMarchon은"이것은미래의위협이아니라이미발생하고있는일입니다"라고말했습니다."현재규정을준수하지않는영수증중AI로생성된것은소수에불과하지만,이는계속증가할것입니다".​공인사기조사관협회(AssociationofCertifiedFraudExaminers)는AI로생성된가짜영수증을"조직에게중요한문제"라고지적하며,사진편집소프트웨어가필요했던이전방법과달리이제설득력있는위조품을만드는데기술적능력이전혀필요하지않다고언급했습니다.
13 조회
0 추천
10.28 등록
(퍼플렉시티가정리한기사)SK하이닉스가인공지능(AI)급성장에대응하는차세대낸드스토리지솔루션을선보이며메모리반도체시장확장에나섰다.회사는지난13~16일(현지시간)미국캘리포니아주새너제이에서열린'2025OCP(오픈컴퓨트프로젝트)글로벌서밋'에서'AIN(AI-NAND)패밀리'제품군을처음공개했다고27일발표했다.​김천성SK하이닉스부사장(eSSD제품개발담당)이직접발표자로나선이번행사에서공개된AIN패밀리는성능(Performance),대역폭(Bandwidth),용량(Density)세가지측면에서각각최적화된낸드솔루션제품들로구성됐다.​고성능·고용량·고대역폭특화제품군AINP(Performance)는대규모AI추론환경에서발생하는방대한데이터입출력을효율적으로처리하는솔루션으로,AI연산과스토리지간병목현상을최소화해처리속도와에너지효율을대폭향상시킨다.회사는낸드와컨트롤러를새로운구조로설계중이며2026년말샘플출시를계획하고있다.​AIND(Density)는저전력·저비용으로대용량데이터를저장하는고용량솔루션으로,기존QLC기반테라바이트(TB)급SSD보다용량을최대페타바이트(PB)급으로높여SSD의속도와HDD의경제성을동시에구현하는것을목표로한다.​가장주목받는제품은AINB(Bandwidth)로,낸드를HBM처럼수직으로적층해대역폭을극대화한'HBF(HighBandwidthFlash)'기술을적용했다.SK하이닉스는HBM개발·생산역량을바탕으로AI추론확대와대규모언어모델(LLM)대형화에따른메모리용량부족문제를해결하기위해일찍부터HBF연구에착수했다고밝혔다.​산업생태계확장박차SK하이닉스는HBF생태계확대를위해지난8월HBF표준화양해각서(MOU)를체결한미국샌디스크와공동으로14일저녁OCP행사장인근에서글로벌빅테크관계자들을초청해'HBF나이트'를개최했다.이행사에는업계주요아키텍트와기술진수십여명이참석해업계차원의협력을논의했다.​안현SK하이닉스개발총괄사장(CDO)은"이번OCP글로벌서밋과HBF나이트를통해AI중심으로급변하는시장환경에서'글로벌AI메모리솔루션프로바이더'로성장한SK하이닉스의현재와미래를선보일수있었다"며"차세대낸드스토리지에서도고객과다양한파트너와협력해AI메모리시장의핵심플레이어로올라설수있도록할것"이라고강조했다.
31 조회
0 추천
10.27 등록
(퍼플렉시티가정리한기사)세계적인AI석학들이서울에모여차세대인공지능기술과한미협력강화방안을논의했다.과학기술정보통신부는27일서울용산드래곤시티에서'AI프론티어국제심포지엄2025'를개최해AI분야최신연구성과를공유하고국제협력방안을모색했다고밝혔다.​얀르쿤"LLM은5년내구식,월드모델이미래"이번심포지엄의핵심은AI분야4대석학중한명인얀르쿤뉴욕대교수의기조강연이었다.메타의수석AI과학자이기도한르쿤교수는"대형언어모델(LLM)은5년안에쓸모없어질것"이라며"AI를인간수준으로발전시키려면LLM이할수없는것을연구해야한다"고강조했다.​르쿤교수는'월드모델학습'을주제로한강연에서"텍스트만으로는인간수준의AI에도달할수없다"며"물리세계를이해하고비디오등감각입력을통해스스로학습하는AI시스템이필요하다"고설명했다.그는"현재AI시스템은물리적세계를이해하는능력에서집고양이보다도똑똑하지못하다"고지적했다.​최예진스탠퍼드대교수는'생성형AI의민주화:스케일링법칙을초월하여'를주제로AI확산과사회적접근성을강조했다.​한미AI협력생태계구축가속화배경훈부총리겸과학기술정보통신부장관은직접좌장을맡아르쿤교수,최예진교수,조경현뉴욕대교수,김기응KAIST교수가참여하는AI석학좌담회를진행했다.배부총리는"대한민국은단순한기술수용국이아니라AI의철학·기준·책임성을함께설계하는파트너가되어야한다"고강조했다.​심포지엄2부에서는국가AI연구거점과글로벌AI프론티어랩의공동연구성과가발표됐다.일본,프랑스,UAE등해외연구자와국내연구진이차세대AI기초연구및피지컬AI를주제로협력성과를공유했다.​28-29일에는글로벌AI프론티어랩워크숍이이어져한미연구자들이AI핵심알고리즘,신뢰성,헬스케어분야미래연구방향을논의할예정이다.배부총리는"국내AI연구의국제경쟁력을더욱강화하기위해AI연구의글로벌협력생태계구축에박차를가할계획"이라고밝혔다.
30 조회
0 추천
10.27 등록
(퍼플렉시티가정리한기사)OpenAICEO샘올트먼은캘리포니아공과대학의저명한생체분자공학자미하일샤피로를자신의뇌-컴퓨터인터페이스스타트업MergeLabs에공식적으로영입하여,이벤처를엘론머스크의Neuralink와직접경쟁하는기업으로포지셔닝했습니다.샤피로의영입은외과적임플란트없이인간의생각을읽는,근본적으로다른뇌-기계인터페이스접근방식을개발하려는올트먼의의지를보여줍니다.​혁신적인초음파기술두개골에구멍을뚫어전극을이식해야하는Neuralink의침습적수술방식과달리,MergeLabs는초음파기반기술과유전자치료를결합하여비침습적뇌-컴퓨터인터페이스를개발하고있습니다.Caltech의분자및세포의학센터소장을맡고있는Shapiro는세포를초음파에가시화하고반응하도록만드는기술을개척했습니다.​"뇌조직에전극을삽입하는대신,세포가초음파에반응하도록수정하는'유전자를세포에도입하는것이더쉽다'고그는말했습니다"라고Shapiro의접근방식에대한최근보고서는전하고있습니다.그의명시된사명은"뇌의뉴런및신체다른부위의세포와인터페이스하는덜침습적인방법을개발하는것"입니다.​이기술은Caltech에서의Shapiro의획기적인연구를기반으로하며,그의팀은기능적초음파가최소한의지연으로뇌활동을성공적으로읽고장치를제어할수있음을입증했습니다.발표된연구에서그의뇌-기계인터페이스는기존임플란트기반시스템처럼매일재보정할필요없이평균오차40도미만으로정확한움직임예측을달성했습니다.​대규모자금조달과시장경쟁MergeLabs는OpenAI의벤처펀드로부터상당한지원을받아8억5천만달러의기업가치평가로2억5천만달러의자금조달을모색하고있는것으로알려졌습니다.Altman은ToolsforHumanity(구Worldcoin)의CEO인AlexBlania와함께공동창업자로활동할예정이지만,일상적인운영책임은맡지않을것으로예상됩니다.​이벤처는뇌-컴퓨터인터페이스시장에서Neuralink의시장선도적지위에직접적으로도전합니다.올해초90억달러의기업가치평가로6억5천만달러를조달한Musk의회사는외과적이식장치로상당한진전을이루었으며현재인체실험을진행하고있습니다.하지만현재까지Neuralink이식장치를받은사람은단7명에불과합니다.​Altman은비침습적접근방식에대한선호를공개적으로밝혀왔습니다.8월언론만찬에서그는Neuralink의인터페이스처럼뉴런을손상시키는"무언가를내뇌에심는것은절대하지않을것"이라고말했습니다."무언가를생각하면ChatGPT가그것에응답하는것을원합니다"라고Altman은덧붙이며,매끄러운인간-AI상호작용에대한자신의비전을설명했습니다.​뇌-컴퓨터인터페이스시장은빠르게확장되고있으며,PrecisionNeuroscience와Synchron같은회사들도실행가능한인간-기계통신시스템개발을위해경쟁하고있습니다.MergeLabs의비침습적접근방식은외과적대안에비해잠재적으로기술을더안전하고주류사용자들이더쉽게접근할수있게만들수있습니다.
32 조회
0 추천
10.27 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입