AI 뉴스

중국 스타트업 MiniMax의 M2가 오픈소스 AI 모델 중 1위

페이지 정보

작성자 xtalfi
작성일 2025.10.29 17:52
2,165 조회
0 추천
0 비추천

본문

67d5401f4201fea22259360979170f81_1761727952_8812.jpg


(퍼플렉시티가 정리한 기사)


중국 AI 스타트업 MiniMax는 월요일에 M2 언어 모델을 출시하여 Artificial Analysis의 Intelligence Index에서 오픈소스 모델 중 최고 점수를 달성했으며, OpenAI와 Anthropic의 독점 시스템에 대한 강력한 경쟁자로 자리매김했습니다.​

이 모델은 종합 벤치마크에서 61점을 기록하여 GPT-5, Grok 4, Claude Sonnet 4.5에 이어 전 세계 5위를 차지했습니다. MiniMax M2는 60점을 기록한 Google DeepMind의 Gemini 2.5 Pro를 앞질렀으며, 이는 중국 오픈소스 AI 생태계에 있어 중요한 성과입니다.​


효율적인 아키텍처가 성능을 강화합니다

MiniMax M2는 총 2,300억 개의 매개변수를 가진 Mixture-of-Experts (MoE) 아키텍처를 채택하지만, 추론 시에는 100억 개만 활성화하여 탁월한 효율성을 제공합니다. Artificial Analysis에 따르면 "매개변수의 일부만 사용함으로써 모델이 대규모에서 효율적으로 작동할 수 있게 되었습니다". 이는 370억 개의 활성 매개변수를 사용하는 DeepSeek의 V3.2 및 320억 개를 사용하는 Moonshot AI의 Kimi K2와 같은 경쟁 모델들과 비교해 유리합니다.​

이러한 희소 설계는 FP8 정밀도로 단 4개의 NVIDIA H100 GPU만으로 배포를 가능하게 하여 중견 조직들도 접근할 수 있게 합니다. 컴팩트한 활성 풋프린트에도 불구하고, M2는 초당 약 100개의 토큰이라는 추론 속도를 제공하며—이는 Claude Sonnet 4.5와 같은 경쟁 모델의 약 두 배에 해당합니다.​


코딩과 에이전트 작업이 탁월함을 이끕니다

MiniMax M2는 특히 에이전트 워크플로우와 코딩 애플리케이션에서 뛰어난 성능을 보이며, 이는 기업들이 점점 더 우선시하는 영역입니다. 이 모델은 전문 벤치마크에서 주목할 만한 점수를 달성했습니다: 실제 코딩 작업을 위한 SWE-bench Verified에서 69.4점, 도구 사용을 위한 τ²-Bench에서 77.2점, 웹 연구 능력을 위한 BrowseComp에서 44.0점을 기록했습니다.​

Artificial Analysis는 "모델의 강점은 도구 사용과 지시 사항 따르기를 포함한다"고 언급하며, M2가 일반화된 작업보다 실용적인 애플리케이션에 중점을 둔다는 점을 강조했습니다. 개발자들의 독립적인 테스트에서 M2는 혼합 작업에서 약 95%의 정확도를 달성한 반면, GPT-4o는 90%, Claude 3.5는 88-89%를 기록했습니다.​

독일 트리어 대학교의 박사과정 학생이자 오픈 모델 전문가인 Florian Brand는 "그들의 진전에 정말 감명받았다"고 언급하며, MiniMax의 이전 M1 모델 대비 상당한 개선을 강조했습니다.​

MiniMax는 입력 토큰 백만 개당 $0.3, 출력 토큰 백만 개당 $1.2로 모델을 제공하여 경쟁력 있는 성능을 유지하면서도 Claude Sonnet 4.5 비용의 단 8%에 해당합니다. 이 모델은 Hugging Face와 GitHub에서 MIT 라이선스로 제공되며, API 액세스는 현재 제한된 기간 동안 무료로 이용할 수 있습니다.

댓글 0
전체 1,366 / 47 페이지
최태원 대한상공회의소 회장이 한국이 글로벌 인공지능(AI) 경쟁에서 살아남기 위해서는 7년 안에 1400조 원을 AI 인프라에 투자해야 한다고 강조했다. 최 회장은 5일 서울 중구 대한상의 국제회의장에서 열린 ‘제4회 한국은행-대한상의 공동 세미나’에서 이창용 한국은행 총재와의 특별대담을 통해 “한국의 잠재성장률이 5년 뒤면 마이너스로 내려갈 상황에 봉착해 있다”며 “AI를 활용한 새로운 성장 동력 확보가 시급하다”고 밝혔다.최 회장은 “AI 경쟁에 제대로 뛰어들려면 20기가와트(GW) 규모의 AI 데이터센터를 만들어야 한다”며 “1기가와트당 약 70조 원이 필요하므로 총 1400조 원 규모의 투자가 이뤄져야 한다”고 설명했다. 이는 2026년도 정부 예산(727조9000억 원)의 약 2배에 달하는 규모다. 그는 “이러한 국가 단위 프로젝트가 자리잡지 않는 이상 한 기업이 할 수 있는 상황이 아니다”고 덧붙였다.민간 주도 AI 발전 역설최 회장은 AI 발전이 국가가 아닌 민간 주도로 이뤄져야 한다고 강조했다. 그는 “AI 경쟁은 월드컵 같은 국가대항전이 아니다”며 “글로벌 경쟁 속에서 민간이 주도권을 놓치지 않도록 국가가 자원을 지원하는 것이 중요하다”고 말했다. 그는 “휴머노이드 로봇 하나 제작하는 데 우리가 1년 걸리는 것을 중국 상하이에선 6개월 안에 해낸다”며 “미국과 중국에 이어 3위라고 하지만 큰 차이가 나는 3위는 의미가 없다”고 지적했다.최 회장은 매력적인 AI 스타트업 육성이 핵심이라고 강조했다. 그는 “수만 개의 AI 스타트업을 만들어내지 못하면 현재 기업만으로 AI 전쟁을 치러내기 어렵다”며 “해외 자본을 끌어오려면 매력적인 회사들이 다수 나와야 한다”고 말했다.AI 버블론에 대한 견해최근 제기되는 AI 버블 논란에 대해 최 회장은 산업 분야와 주식시장을 구분해 답했다. 그는 “산업을 보면 버블이 아니지만 주식시장은 항상 오버슈팅이 있다”며 “전 세계의 돈이 너무 많이 풀린 상황에서 투기심리가 작동해 어느 정도 오버슈팅이 있을 수 있다”고 진단했다. 이에 대해 이 총재는 “주식시장이 그러지 않았으면 한다”며 우려를 표했다.이날 대담에서는 스테이블코인 도입에 관한 논의도 이뤄졌다. 이 총재는 “한국은행도 스테이블코인이 들어와야 한다는 입장”이라면서도 “은행을 중심으로 먼저 도입해야 한다”고 밝혔다.
985 조회
0 추천
2025.12.05 등록
이재명 대통령은 5일 서울 용산 대통령실에서 손정의 소프트뱅크그룹 회장을 만나 한일 간 인공지능(AI) 협력의 중요성을 강조하며, 손 회장에게 양국 협력의 가교 역할을 해 줄 것을 요청했습니다. 이 대통령은 손 회장이 과거 김대중, 문재인 대통령 시절에도 한국 경제 발전에 큰 도움을 주었음을 언급하며 감사를 표했고, 한국이 AI 분야에서 세계 3대 강국을 지향하고 있음을 밝혔습니다. 또한, 이 대통령은 AI 역량을 모든 국민과 국가가 함께 누리는 '인공지능 기본사회' 개념으로 활용하여 모든 국민과 기업이 AI를 활용하는 사회를 만들고자 하는 정부의 목표를 설명했습니다.이에 대해 손정의 회장은 과거 브로드밴드와 인공지능을 강조했던 것에 이어, 현재는 **'초인공지능(ASI, Artificial Super Intelligence)'**이 다음으로 임박한 핵심 기술이라고 역설했습니다. 손 회장이 정의하는 초인공지능은 인간 두뇌보다 1만 배 뛰어난 두뇌를 의미하며, 인류가 범용 인공지능(AGI)이 아닌 초인공지능의 등장 시점을 고민해야 한다고 주장했습니다. 그는 이제 인류가 AI를 통제하려 하기보다, 새로운 사고방식을 통해 AI와 조화롭게 함께 살아가는 방법을 모색해야 할 때라고 강조하며, 초인공지능이 친절하고 사람들을 행복하게 해 줄 것이므로 인류를 위협할 것을 걱정할 필요는 없다고 덧붙였습니다.대통령과 손 회장의 대화에서는 AI 버블 논란, 초인공지능의 문학상 석권 가능성 등 다양한 주제가 오갔으며, 이 대통령은 AI가 과학 분야에서 노벨상을 받는 상황뿐 아니라 노벨문학상까지 석권할 수 있을지에 대해 질문하기도 했습니다. 손 회장은 그럴 수 있을 것이라고 답하며 미래 AI 기술에 대한 강한 확신을 드러냈습니다. 한편, 이 대통령은 면담 말미에 손 회장이 구단주로 있는 일본 프로야구팀 '소프트뱅크 호크스'의 우승을 언급하며 축하 인사를 건네는 등 우호적인 분위기 속에서 회담을 마무리했습니다.
1002 조회
0 추천
2025.12.05 등록
• 연구자들과 칩 제조업체들은 뇌의 신경 구조를 모방하는 뉴로모픽 프로세서의 상용화를 위해 경쟁하고 있으며, 이는 데이터 센터의 예상 소비량이 2024년 415테라와트시에서 2030년까지 945TWh로 증가함에 따라 기존 칩 대비 100배에서 1,000배의 에너지 효율성 향상을 약속하고 있습니다.• Intel과 IBM은 에너지 집약적인 데이터 전송을 제거하기 위해 메모리와 프로세싱을 통합한 Loihi 2 및 NorthPole과 같은 프로토타입 칩을 선보였으며, NorthPole은 이미지 인식 작업에서 NVIDIA의 V100 GPU보다 25배 더 에너지 효율적임이 입증되었습니다.• 12월 4일, 네덜란드 기반의 Innatera는 뉴로모픽 컴퓨팅 시장이 2025년 48억 9천만 달러에서 2035년까지 761억 8천만 달러로 성장할 것으로 예상됨에 따라, 1밀리와트 미만의 Pulsar 칩을 상용 제품에 배포하는 것을 가속화하기 위해 영국 컨설팅 회사 42 Technology와의 파트너십을 발표했습니다.
984 조회
0 추천
2025.12.05 등록
현대자동차의 첨단차량플랫폼 부문장이자 소프트웨어 자회사 42dot의 CEO인 송창현은 자율주행 기술의 더딘 진전 속에서 정의선 회장과의 논의 끝에 사임했다.[yna +1]현대는 최근 한국에서 완전 자율주행 시스템을 출시한 Tesla [ +1.74%], 그리고 이미 레벨 3 자율주행을 양산 차량에 통합한 Mercedes-Benz와 BMW 같은 경쟁사들에 뒤처져 있다.[yna +1]분석가들은 이번 사임이 독자 개발보다는 Nvidia [ +2.11%]와의 파트너십으로의 전략적 전환을 시사하며, 앞으로 몇 주 안에 더 광범위한 임원진 변화가 예상된다고 말한다.[koreatimes +1]
1003 조회
0 추천
2025.12.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입