Loading...

AI 뉴스

중국 스타트업 MiniMax의 M2가 오픈소스 AI 모델 중 1위

페이지 정보

작성자 xtalfi
작성일 2025.10.29 17:52
16 조회
0 추천
0 비추천

본문

67d5401f4201fea22259360979170f81_1761727952_8812.jpg


(퍼플렉시티가 정리한 기사)


중국 AI 스타트업 MiniMax는 월요일에 M2 언어 모델을 출시하여 Artificial Analysis의 Intelligence Index에서 오픈소스 모델 중 최고 점수를 달성했으며, OpenAI와 Anthropic의 독점 시스템에 대한 강력한 경쟁자로 자리매김했습니다.​

이 모델은 종합 벤치마크에서 61점을 기록하여 GPT-5, Grok 4, Claude Sonnet 4.5에 이어 전 세계 5위를 차지했습니다. MiniMax M2는 60점을 기록한 Google DeepMind의 Gemini 2.5 Pro를 앞질렀으며, 이는 중국 오픈소스 AI 생태계에 있어 중요한 성과입니다.​


효율적인 아키텍처가 성능을 강화합니다

MiniMax M2는 총 2,300억 개의 매개변수를 가진 Mixture-of-Experts (MoE) 아키텍처를 채택하지만, 추론 시에는 100억 개만 활성화하여 탁월한 효율성을 제공합니다. Artificial Analysis에 따르면 "매개변수의 일부만 사용함으로써 모델이 대규모에서 효율적으로 작동할 수 있게 되었습니다". 이는 370억 개의 활성 매개변수를 사용하는 DeepSeek의 V3.2 및 320억 개를 사용하는 Moonshot AI의 Kimi K2와 같은 경쟁 모델들과 비교해 유리합니다.​

이러한 희소 설계는 FP8 정밀도로 단 4개의 NVIDIA H100 GPU만으로 배포를 가능하게 하여 중견 조직들도 접근할 수 있게 합니다. 컴팩트한 활성 풋프린트에도 불구하고, M2는 초당 약 100개의 토큰이라는 추론 속도를 제공하며—이는 Claude Sonnet 4.5와 같은 경쟁 모델의 약 두 배에 해당합니다.​


코딩과 에이전트 작업이 탁월함을 이끕니다

MiniMax M2는 특히 에이전트 워크플로우와 코딩 애플리케이션에서 뛰어난 성능을 보이며, 이는 기업들이 점점 더 우선시하는 영역입니다. 이 모델은 전문 벤치마크에서 주목할 만한 점수를 달성했습니다: 실제 코딩 작업을 위한 SWE-bench Verified에서 69.4점, 도구 사용을 위한 τ²-Bench에서 77.2점, 웹 연구 능력을 위한 BrowseComp에서 44.0점을 기록했습니다.​

Artificial Analysis는 "모델의 강점은 도구 사용과 지시 사항 따르기를 포함한다"고 언급하며, M2가 일반화된 작업보다 실용적인 애플리케이션에 중점을 둔다는 점을 강조했습니다. 개발자들의 독립적인 테스트에서 M2는 혼합 작업에서 약 95%의 정확도를 달성한 반면, GPT-4o는 90%, Claude 3.5는 88-89%를 기록했습니다.​

독일 트리어 대학교의 박사과정 학생이자 오픈 모델 전문가인 Florian Brand는 "그들의 진전에 정말 감명받았다"고 언급하며, MiniMax의 이전 M1 모델 대비 상당한 개선을 강조했습니다.​

MiniMax는 입력 토큰 백만 개당 $0.3, 출력 토큰 백만 개당 $1.2로 모델을 제공하여 경쟁력 있는 성능을 유지하면서도 Claude Sonnet 4.5 비용의 단 8%에 해당합니다. 이 모델은 Hugging Face와 GitHub에서 MIT 라이선스로 제공되며, API 액세스는 현재 제한된 기간 동안 무료로 이용할 수 있습니다.

댓글 0
전체 644 / 16 페이지
(퍼플렉시티가정리한기사)중국AI스타트업MiniMax는월요일에M2언어모델을출시하여ArtificialAnalysis의IntelligenceIndex에서오픈소스모델중최고점수를달성했으며,OpenAI와Anthropic의독점시스템에대한강력한경쟁자로자리매김했습니다.​이모델은종합벤치마크에서61점을기록하여GPT-5,Grok4,ClaudeSonnet4.5에이어전세계5위를차지했습니다.MiniMaxM2는60점을기록한GoogleDeepMind의Gemini2.5Pro를앞질렀으며,이는중국오픈소스AI생태계에있어중요한성과입니다.​효율적인아키텍처가성능을강화합니다MiniMaxM2는총2,300억개의매개변수를가진Mixture-of-Experts(MoE)아키텍처를채택하지만,추론시에는100억개만활성화하여탁월한효율성을제공합니다.ArtificialAnalysis에따르면"매개변수의일부만사용함으로써모델이대규모에서효율적으로작동할수있게되었습니다".이는370억개의활성매개변수를사용하는DeepSeek의V3.2및320억개를사용하는MoonshotAI의KimiK2와같은경쟁모델들과비교해유리합니다.​이러한희소설계는FP8정밀도로단4개의NVIDIAH100GPU만으로배포를가능하게하여중견조직들도접근할수있게합니다.컴팩트한활성풋프린트에도불구하고,M2는초당약100개의토큰이라는추론속도를제공하며—이는ClaudeSonnet4.5와같은경쟁모델의약두배에해당합니다.​코딩과에이전트작업이탁월함을이끕니다MiniMaxM2는특히에이전트워크플로우와코딩애플리케이션에서뛰어난성능을보이며,이는기업들이점점더우선시하는영역입니다.이모델은전문벤치마크에서주목할만한점수를달성했습니다:실제코딩작업을위한SWE-benchVerified에서69.4점,도구사용을위한τ²-Bench에서77.2점,웹연구능력을위한BrowseComp에서44.0점을기록했습니다.​ArtificialAnalysis는"모델의강점은도구사용과지시사항따르기를포함한다"고언급하며,M2가일반화된작업보다실용적인애플리케이션에중점을둔다는점을강조했습니다.개발자들의독립적인테스트에서M2는혼합작업에서약95%의정확도를달성한반면,GPT-4o는90%,Claude3.5는88-89%를기록했습니다.​독일트리어대학교의박사과정학생이자오픈모델전문가인FlorianBrand는"그들의진전에정말감명받았다"고언급하며,MiniMax의이전M1모델대비상당한개선을강조했습니다.​MiniMax는입력토큰백만개당$0.3,출력토큰백만개당$1.2로모델을제공하여경쟁력있는성능을유지하면서도ClaudeSonnet4.5비용의단8%에해당합니다.이모델은HuggingFace와GitHub에서MIT라이선스로제공되며,API액세스는현재제한된기간동안무료로이용할수있습니다.
17 조회
0 추천
2025.10.29 등록
(퍼플렉시티가정리한기사)알바니아의획기적인인공지능장관디엘라(Diella)가국회의원들의개인비서역할을할83개의디지털자녀를"출산"할준비를하고있다고에디라마(EdiRama)총리가베를린글로벌대화컨퍼런스에서발표했다.​10월27일연설에서라마총리는83개의AI비서각각이사회당국회의원에게배정되어회의를기록하고,요약을제공하며,입법절차중응답을제안할것이라고밝혔다."우리는오늘디엘라와함께상당한위험을감수했고매우잘해냈습니다.그래서처음으로디엘라가임신했고83명의자녀를가지게되었습니다"라고라마총리는말했다.​혁명적인AI거버넌스실험알바니아어로"태양"을의미하는이름을가진디엘라는2025년9월세계최초로장관급정부직책을맡은AI시스템이되면서역사를만들었다.OpenAI모델을사용하여과협력하여개발된이디지털장관은부패를근절하기위해알바니아의공공조달시스템을감독하는임무를맡았다.​이AI보좌관네트워크는인공지능이입법기능으로확장된전례없는사례를보여준다.라마에따르면,각디지털자손은"의회회의에참여하고일어나는모든일의기록을보관하며국회의원들에게제안할것"이라고한다.그는이들의유용성을유머러스하게설명했다:"예를들어,커피를마시러갔다가일터로돌아오는것을잊어버리면,이자손이당신이의사당에없을때무슨말이오갔는지말해주고,누구에게반격해야하는지알려줄것입니다".​디지털비서에서정부장관으로장관임명이전,Diella는2025년1월e-Albania플랫폼에서가상비서로시작하여시민과기업이공식문서를취득하고정부서비스를이용할수있도록지원했습니다.이시스템은이미백만건이상의디지털문의를처리하고36,000건이상의문서를발급했습니다.​Diella는전통알바니아의상을입은여성으로나타나며,알바니아배우AnilaBisha가2025년12월까지유효한계약에따라외모와목소리를제공하고있습니다.9월첫의회연설에서AI장관은다음과같이말했습니다:"저는사람들을대체하기위해여기있는것이아니라그들을돕기위해있습니다.사실,저는시민권이없지만개인적인야망이나이해관계도없습니다".​AI장관시스템은알바니아가유럽연합가입노력을계속하고기술을통해거버넌스구조를현대화함에따라2026년말까지완전히가동될것으로예상됩니다.
33 조회
0 추천
2025.10.28 등록
(퍼플렉시티가정리한기사)존스홉킨스대학교연구진은프로그래밍학습이새로운뇌경로를생성하는것이아니라논리적추론을담당하는기존신경망을"재활용"한다는것을발견했으며,이는우리의마음이현대기술능력에어떻게적응하는지에대한새로운통찰을제공한다.​뇌의프로그래밍기반은이미존재함이번주JournalofNeuroscience에게재된이연구는프로그래밍경험이없는22명의학부생을대상으로한학기동안의Python입문과정을이수하기전과후에기능적자기공명영상(fMRI)을사용하여추적했다.​가장놀라운발견은학생들이프로그래밍을배우기전에도,나중에코드를처리할동일한신경세포그룹이학생들이프로그래밍알고리즘에대한평이한영어설명을읽을때이미활성화되어있었다는것이다.박사후연구원인제1저자Yun-FeiLiu에따르면,"우리는참가자들에게Python을배우기전에평이한영어로설명된프로그래밍알고리즘을보여주었습니다.이런식으로제시될때뇌의언어네트워크가이정보를이해하는데중요할것이라고생각할수있습니다.그러나주로활성화된뇌네트워크는논리적추론네트워크였습니다".​과정을이수한후,논리와추론을담당하는이동일한전두-두정엽뇌영역이실제Python코드의의미를표상했다.연구자들은신경세포가"for"루프와"if"조건문과같은다양한유형의프로그래밍구조를교육전후모두에서구별할수있음을발견했다.​신경재활용은가정에도전한다뇌의가소성과발달을연구하는인지신경과학자마리나베드니(MarinaBedny)책임저자는그의미를이렇게설명했다."현대사회에서우리가하는많은일들은,프로그래밍을비롯해운전,읽기,수학등,우리의뇌가애초에진화하여하도록만들어진것이아닙니다.프로그래밍수업은우리의논리적사고영역을코드를위해'재사용'합니다.우리가발견한것은,대학에들어올무렵이미프로그래밍을위한신경학적기초가뇌안에마련되어있다는것입니다".​이는'신경재활용가설'을뒷받침하는데,이는문화적기술이완전히새로운뇌네트워크를만드는것이아니라기존의뇌네트워크를재활용한다는이론입니다.연구결과에따르면,이재활용과정은단한학기수업만으로도빠르게일어납니다.​류(Liu)는이번발견이코드를배울수있는대상에대한더넓은관점을제공한다고언급했다."프로그래밍을배우는것은우리가논리적문제해결에사용하는동일한신경기계를활용하는것입니다.누구나이런능력을가지고있습니다".베드니는이어서"코딩에익숙하지않은사람들은파이썬을보고절대이해하지못할것같다고느낄수도있지만,우리연구는모두에게코딩할수있는잠재력이있음을시사합니다.어쩌면우리는태어날때부터이미그런능력을가지고있을지도모릅니다".​이번연구는퍼즐,게임,일상적인문제해결토론등의활동이학생들이논리적추론능력을강화함으로써미래의프로그래밍성공을준비하는데도움이될수있음을시사합니다.
35 조회
0 추천
2025.10.28 등록
(퍼플렉시티가정리한기사)과학자들과기상기관들이인공지능을활용하여홍수및폭풍해일예보를획기적으로개선하고있으며,새로운연구에따르면AI강화모델이기존방법보다더빠르고정확하게자연재해를예측할수있을뿐만아니라전세계적으로이전에서비스가부족했던지역으로범위를확대할수있는것으로나타났다.글로벌지지가AI통합을가속화하다세계기상기구(WMO)는10월23일임시세계기상총회에서기상예보및조기경보시스템에인공지능을공식적으로승인하며,AI의"생명을구하는잠재력"을활용하기위한글로벌협력을촉구했다.총회는2027년까지전세계적적용을목표로하는모두를위한조기경보(EarlyWarningsforAll)이니셔티브를가속화하기위한결의안을승인했으며,AI는전통적인예보방법을보완하는역할을할것이다.​안토니우구테흐스유엔사무총장은총회에서"조기경보는추상적인개념이아닙니다.이는농부들에게농작물과가축을보호할수있는힘을주고,가족들이안전하게대피할수있게하며,전체지역사회를재앙으로부터보호합니다"라고말했다.강력한조기경보시스템을갖춘국가들은그러한시스템이없는국가들보다재난사망률이6배낮은것으로나타났다.​혁신적인홍수예측모델펜실베이니아주립대학교의연구진들은AI와물리기반모델링을결합하여전세계적으로홍수영향을예측하는획기적인수문학모델을개발했다고NatureCommunications에발표된연구에따르면밝혔다.이모델은전세계적으로36제곱킬로미터정도의작은지역을시뮬레이션할수있으며,데이터가풍부한지역에서는6제곱킬로미터까지확대할수있다.​"이모델은전세계수문학의판도를바꿀것입니다"라고펜실베이니아주립대학교의토목및환경공학교수인ChaopengShen이말했다.이시스템은전세계기상관련재해의최대40%를차지하고연간3,880억달러의손실을발생시키는증가하는홍수위기를해결한다.​한편,미시간대학교연구진들은AI가전통적인물리기반접근법과결합될때NOAA의NationalWaterModel의정확도를4배에서6배까지향상시킬수있다는것을입증했다.이하이브리드시스템은홍수예측의오류를식별하고수정하도록훈련된신경망을사용하여미국전역에서더신뢰할수있는예측을제공한다.​폭풍해일예측가속화최신연구에따르면AI모델은이웃수준의정확도를유지하면서폭풍해일예측시간을수시간에서수분으로단축하고있습니다.기존의수리역학모델은고해상도시뮬레이션에상당한계산시간이필요하지만,AI로훈련된시스템은풍장데이터를처리해수분만에상세한홍수위험지도를생성할수있습니다.​엔지니어들은딥러닝신경망을기반으로한AI모델을개발했으며,이모델들은일부경우기존수리역학모델보다해안수위를더정확하게예측할수있습니다.이러한시스템은제한된과거데이터나아직발생하지않은극한상황에도예측을생성할수있습니다.​AI모델이전세계홍수및폭풍해일예측을발전시키다과학자들과기상조직들은홍수및폭풍해일예측을획기적으로개선하기위해인공지능을배치하고있으며,새로운연구에따르면AI로강화된모델은기존방법보다더빠르고정확하게자연재해를예측할수있을뿐만아니라전세계의이전에서비스가부족했던지역까지범위를확대할수있다고합니다.
31 조회
0 추천
2025.10.28 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입