Loading...

AI 뉴스

전 DeepSeek AI 연구원 Luo Fuli, 샤오미에 합류

페이지 정보

작성자 xtalfi
작성일 11.12 22:46
4 조회
0 추천
0 비추천

본문

1738219880.jpg

(퍼플렉시티가 정리한 기사)


전 DeepSeek 연구원 Luo Fuli는 11월 12일의 MiMo AI 팀에 합류했다고 발표했으며, 이는 중국 기술 대기업의 수개월간의 채용 노력의 결실을 의미하고 중국의 급속도로 발전하는 인공지능 산업에서 AI 인재에 대한 치열한 경쟁을 강조한다.​

"지능은 언어를 넘어 물리적 세계로 나아갈 것입니다"라고 Luo는 자신의 WeChat 계정에 썼다. "저는 샤오미 MiMo에서 창의적이고 재능 있으며 진실한 연구원들과 함께 그러한 미래를 만들어갈 것입니다."​

PanDaily에 따르면, DeepSeek의 V2 모델에 기여한 것으로 알려진 29세 연구원은 MiMo 팀의 책임자로 임명되었다. 그녀의 합류는 스마트폰, 전기차, 스마트 홈 기기를 통합하는 "Human x Car x Home" 생태계를 개발하는 샤오미의 AI 역량을 강화할 것으로 예상된다.​


AI 인재 확보를 위한 치열한 경쟁

샤오미 창립자 레이쥔은 루오 영입을 위해 직접 나섰으며, 중국 언론은 연간 보수 패키지가 1천만 위안, 약 140만 달러라고 보도했습니다. 이번 영입은 기술 대기업들이 전문 인재를 확보하기 위해 치열하게 경쟁하고 있는 중국 AI 산업의 광범위한 트렌드를 반영합니다.​

맥킨지의 데이터에 따르면, AI 제품 구축에 능숙한 인재에 대한 중국의 수요는 2030년까지 100만 명에서 600만 명으로 6배 증가할 것으로 예상되는 반면, 대학 및 기존 인재 풀은 약 200만 명만 공급할 것으로 추정되어 AI 역할에 대한 400만 명의 인력 부족이 발생할 것으로 전망됩니다.​

루오는 샤오미에 상당한 자격을 가져왔습니다. 그녀는 베이징대학교 전산언어학연구소에서 석사 학위를 취득했으며 2019년 권위 있는 ACL 컨퍼런스에서 8편의 논문을 발표했습니다. 졸업 후 그녀는의 DAMO Academy에 합류하여 다국어 사전 학습 모델 VECO 개발을 주도했습니다. 2022년 그녀는 DeepSeek에 합류하여 2024년 5월에 출시된 DeepSeek-V2 모델의 핵심 기여자가 되었습니다.​

DeepSeek-V2는 Multi-head Latent Attention을 도입하여 품질을 유지하면서 최첨단 AI 모델 학습에 필요한 컴퓨팅 요구사항을 절반으로 줄이는 혁신을 이루었습니다. 이 획기적인 성과는 업계 리더들의 주목을 받았으며, Anthropic 창립자 잭 클락은 DeepSeek이 이러한 발전을 이룰 수 있는 "불가사의한 마법사들"을 고용했다고 언급했습니다.​


샤오미의 AI 야망

샤오미는 2025년 4월 첫 대규모 언어 모델인 MiMo를 출시했습니다. 70억 개의 매개변수를 가진 이 모델은 추론 작업에 중점을 두고 있으며, Core로 알려진 회사의 AI 태스크포스가 강화 학습을 사용하여 개발했습니다. 벤치마크 테스트에서 샤오미는 이 모델이 수학 및 코드 생성 분야에서 OpenAI의 o1-mini와 알리바바의 Qwen-32B-Preview의 성능과 대등하거나 이를 초과한다고 주장했습니다.​

Luo는 이미 10월에 샤오미와 베이징대학교가 공동으로 발표한 최근 AI 논문에 "독립 연구원"으로 공동 저자로 등장했으며, 업계 관계자들은 이를 경업금지 의무와 관련된 전환 기간으로 해석했습니다. 11월 12일 그녀의 공식 발표는 샤오미 팀에 완전히 합류했음을 확인했습니다.

댓글 0
전체 908 / 8 페이지
(퍼플렉시티가정리한기사)전구글CEO에릭슈미트는중국의오픈소스인공지능모델이우수한품질때문이아니라무료이기때문에글로벌표준이될수있다는강력한경고를발표했습니다.화요일에공개된Moonshots팟캐스트에서슈미트는대부분의국가들이비용제약으로인해DeepSeek와알리바바의Qwen같은중국AI시스템을채택할것을가장우려한다고말했습니다."이것은미국의가장큰모델들은폐쇄형소스이고중국의가장큰모델들은오픈소스인기묘한결과를만들어냅니다"라고슈미트는말했습니다."서방이가진종류의자금을갖지못한대다수의정부와국가들은중국모델이더나아서가아니라무료이기때문에결국중국모델을표준으로채택하게될것입니다."​이러한우려는이론적인것이상입니다.블룸버그에따르면,개발자플랫폼HuggingFace에서중국모델의다운로드수가이미미국대안을초과했습니다.알리바바의Qwen모델은메타의Llama의3억4,620만건에비해약3억8,530만건의다운로드를기록했습니다.중국출처의파생모델은이제HuggingFace의새로운언어모델출시의40%이상을차지하는반면,메타의점유율은약15%로떨어졌습니다.​실리콘밸리가중국모델을채택하다이러한변화는이미미국기업들에영향을미치고있습니다.에어비앤비CEO브라이언체스키는10월에자신의회사가AI기반고객서비스를위해알리바바의Qwen모델에"크게의존"하고있으며,이를"매우좋고,빠르고,저렴하다"고평가했습니다.벤처캐피털리스트차마스팔리하피티야는자신의팟캐스트에서함께일하는한회사가비용이점을이유로중국스타트업MoonshotAI의KimiK2모델로주요작업량을이전했다고말했습니다.​주권AI논쟁심화"주권AI"—국가가자국의AI기술,데이터및인프라를통제하는것—에대한논쟁이점점더시급해지고있다.NvidiaCEO젠슨황은올해초두바이에서열린세계정부정상회의에서각국정부관계자들에게문화적·기술적독립성을보존하기위해각국이자체대규모언어모델을구축해야한다고말했다.11월에황은"중국이AI경쟁에서승리할것"이라고경고한후,중국이미국보다"나노초뒤처져있다"고설명했다​2001년부터2015년까지Google을이끌었고현재항공스타트업RelativitySpace를운영하고있는슈미트는오픈소스대클로�드소스의구분이잠재적인지정학적단층선이될수있다고말했다.이러한추세는데이터프라이버시,국가안보,그리고AI분야에서미국의경쟁우위에대한우려를불러일으킨다.
5 조회
0 추천
11.12 등록
(퍼플렉시티가정리한기사)AntInternational은전세계기업을위한시계열예측을혁신하도록설계된오픈소스인공지능모델인FalconTST를공개했습니다.2025년싱가포르핀테크페스티벌에서발표된이모델은현재GitHub와HuggingFace에서전세계개발자및연구기관이이용할수있습니다.​싱가포르에본사를둔이핀테크회사는FalconTST를여러패치토크나이저를갖춘업계최초의MixtureofExperts아키텍처기반시계열예측모델로설명하며,최대25억개의매개변수를지원합니다.AntInternationalCEOYangPeng에따르면,이모델은현재회사글로벌거래의약60%를처리하고있으며,2025년첫10개월동안거래액은1.5조달러에달해2024년대비36%증가했습니다.​통화관리에서입증된결과FalconTST는2024년부터AntInternational에내부적으로배포되어시간별,일별,주별현금흐름및외환익스포저예측에서90%를초과하는정확도를달성했습니다.이모델은여러출처에따르면회사의외환비용을최대60%까지절감하는데기여했습니다.​AntInternational의최고혁신책임자인Jiang-MingYang은"검증된FalconTST모델을오픈소스화함으로써전세계과학자들이실제피드백을제공하고시계열학습의혁신을가속화하도록초대하여글로벌협업을통해이분야를발전시키는것을목표로합니다"라고말했습니다.​이모델은이미여러부문의산업파트너들과함께배포되었습니다.2025년7월,Citi와AntInternational은아시아의한항공사와함께FalconTST모델을시범운영하여초기실제거래에서외환헤지비용을30%절감했습니다.별도로CapitalA는AirAsia를위해이모델을활용하여90%의예측정확도를달성하면서외환헤지비용을최대40%까지절감했습니다.​산업전반에걸친광범위한응용재무예측을넘어,FalconTST는기업들이날씨패턴,달력이벤트,금융시장변동,국경간교통량을포함한다양한시계열데이터를예측할수있도록지원합니다.국제공항협의회(AirportsCouncilInternationalWorld)가2025년전세계항공여행객이98억명에달할것으로전망하는가운데,항공사자금관리분야에서이모델의활용은전세계소비자들의비용절감으로이어질수있습니다.​이회사는또한Shield라는두번째AI기초모델을개발했습니다.이는80억개의매개변수를가진결제위험통제모델로,매일2,200만건의거래를보호하며사기를13.5%감소시킵니다.
6 조회
0 추천
11.12 등록
(퍼플렉시티가정리한기사)바이두는11월11일ERNIE-4.5-VL-28B-A3B-Thinking을공개했다.이는오픈소스멀티모달AI모델로,중국기술대기업은이모델이여러벤치마크에서OpenAI의GPT-5와구글의Gemini2.5Pro를능가한다고주장한다.이번출시는중국과서구기술기업간격화되는인공지능경쟁에서중요한확대를의미한다.​허용적인Apache2.0라이선스로공개된이모델은총280억개의파라미터를가진전문가혼합(Mixture-of-Experts)아키텍처를사용하지만,추론당30억개만활성화하여높은성능을유지하면서도계산비용을획기적으로줄인다.바이두의발표에따르면,이모델은문서및차트이해분야의VQA,MMBench,SEED-Bench평가에서Gemini2.5Pro를능가한다.​효율성과성능의만남경량설계를통해ERNIE-4.5-VL은비슷한수준의전체매개변수모델보다2~3배빠른추론속도를제공하면서도훨씬적은메모리를요구합니다.이모델은이미지의특정영역을확대하고,잘라낸뷰를분석하며,국소적관찰을종합적인답변으로통합할수있는혁신적인"이미지를통한사고(ThinkingwithImages)"기능을도입했습니다.​바이두연구진은동적난이도샘플링을적용한GSPO및IcePop을포함한고급강화학습전략을활용하여대규모시각-언어추론데이터에대한광범위한중간학습단계를통해이모델을훈련했습니다.이모델은시각적추론,STEM문제해결,시각적그라운딩,도구활용및비디오이해분야에서뛰어난성능을발휘합니다.​전략적오픈소스추진이번출시는중국이미국기업들과경쟁하기위해오픈소스AI전략을강화하는가운데이루어졌습니다.최근분석에따르면,중국은오픈소스AI다운로드에서미국을앞질렀으며,DeepSeek,Alibaba,Baidu같은기업들이서구경쟁사들보다더빠르고저렴하게고성능모델을생산할수있음을입증하고있습니다.​남가주대학교(UniversityofSouthernCalifornia)의SeanRen은CNBC에"주요연구소가강력한모델을오픈소스로공개할때마다업계전체의기준이높아진다"고말했습니다.이러한움직임은독점API와프리미엄가격에의존하는OpenAI와Anthropic같은비공개소스제공업체들에압박을가하고있습니다.​Baidu는11월13일베이징에서열리는BaiduWorld2025컨퍼런스에서ERNIE라인업과추가AI발전사항을선보일예정입니다.이는중국의경쟁적인AI환경에서선두주자로서의입지를굳히기위한노력의일환입니다.
5 조회
0 추천
11.12 등록
(퍼플렉시티가정리한기사)막스플랑크기상연구소의연구자들은기후과학자들이그들의분야에서"성배"라고부르는것을달성했습니다:기상예보와기후모델링을완벽하게결합한1.25킬로미터해상도의지구디지털트윈입니다.​11월3일arXiv에제출된논문에자세히설명된이획기적인성과는거의킬로미터규모에서전체지구시스템의최초전지구시뮬레이션을나타내며,대기,해양,육지를통한에너지,물,탄소의흐름을포착합니다.DanielKlocke가이끄는팀은6억7천2백만개의셀을모델링했습니다—지구의육지와해양표면을덮는3억3천6백만개의셀과그위에쌓인동일한수의대기셀입니다.​전례없는컴퓨팅파워이시뮬레이션은유럽에서가장강력한두슈퍼컴퓨터에걸쳐방대한컴퓨팅리소스를필요로했습니다:스위스의Alps시스템에서8,192개의GPU와독일의JUPITER에서20,480개의GPU를사용했습니다.두시스템모두Nvidia의새로운GH200GraceHopper슈퍼칩을활용하며,이는GPU와CPU기능을결합하여모델의다양한측면을처리합니다.​연구팀은하루당145.7일의시뮬레이션을수행하는시간압축을달성했으며,거의1조개의자유도(모델이계산해야하는값의총개수)를사용했습니다.이러한성능은유사한해상도의이전대기전용시뮬레이션을능가하며,지구시스템상호작용에대한장기연구를가능하게합니다.​해상도장벽돌파하기진정한혁신은이해상도에서"빠른"지구시스템프로세스와"느린"지구시스템프로세스를결합하는데있습니다.빠른시스템에는날씨를지배하는에너지및물순환이포함되며,폭풍이개별격자셀을가로질러이동함에따라몇분마다업데이트됩니다.느린프로세스에는탄소순환,생물권변화,그리고수년또는수십년에걸쳐진화하는해양지구화학이포함됩니다.​UniverseToday에따르면,이러한복잡한시스템을통합하는일반적인모델은40킬로미터를초과하는해상도에서만계산적으로처리가능했습니다.돌파구는수십년된Fortran코드베이스를현대화한Data-CentricParallelProgramming프레임워크를사용한정교한소프트웨어엔지니어링을통해이루어졌습니다.​이연구로팀은11월18일슈퍼컴퓨팅컨퍼런스에서발표될예정인권위있는GordonBellPrizeforClimateModelling후보로지명되었습니다.
5 조회
0 추천
11.12 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입