AI 뉴스

중국 스타트업 MiniMax의 M2가 오픈소스 AI 모델 중 1위

페이지 정보

작성자 xtalfi
작성일 2025.10.29 17:52
2,159 조회
0 추천
0 비추천

본문

67d5401f4201fea22259360979170f81_1761727952_8812.jpg


(퍼플렉시티가 정리한 기사)


중국 AI 스타트업 MiniMax는 월요일에 M2 언어 모델을 출시하여 Artificial Analysis의 Intelligence Index에서 오픈소스 모델 중 최고 점수를 달성했으며, OpenAI와 Anthropic의 독점 시스템에 대한 강력한 경쟁자로 자리매김했습니다.​

이 모델은 종합 벤치마크에서 61점을 기록하여 GPT-5, Grok 4, Claude Sonnet 4.5에 이어 전 세계 5위를 차지했습니다. MiniMax M2는 60점을 기록한 Google DeepMind의 Gemini 2.5 Pro를 앞질렀으며, 이는 중국 오픈소스 AI 생태계에 있어 중요한 성과입니다.​


효율적인 아키텍처가 성능을 강화합니다

MiniMax M2는 총 2,300억 개의 매개변수를 가진 Mixture-of-Experts (MoE) 아키텍처를 채택하지만, 추론 시에는 100억 개만 활성화하여 탁월한 효율성을 제공합니다. Artificial Analysis에 따르면 "매개변수의 일부만 사용함으로써 모델이 대규모에서 효율적으로 작동할 수 있게 되었습니다". 이는 370억 개의 활성 매개변수를 사용하는 DeepSeek의 V3.2 및 320억 개를 사용하는 Moonshot AI의 Kimi K2와 같은 경쟁 모델들과 비교해 유리합니다.​

이러한 희소 설계는 FP8 정밀도로 단 4개의 NVIDIA H100 GPU만으로 배포를 가능하게 하여 중견 조직들도 접근할 수 있게 합니다. 컴팩트한 활성 풋프린트에도 불구하고, M2는 초당 약 100개의 토큰이라는 추론 속도를 제공하며—이는 Claude Sonnet 4.5와 같은 경쟁 모델의 약 두 배에 해당합니다.​


코딩과 에이전트 작업이 탁월함을 이끕니다

MiniMax M2는 특히 에이전트 워크플로우와 코딩 애플리케이션에서 뛰어난 성능을 보이며, 이는 기업들이 점점 더 우선시하는 영역입니다. 이 모델은 전문 벤치마크에서 주목할 만한 점수를 달성했습니다: 실제 코딩 작업을 위한 SWE-bench Verified에서 69.4점, 도구 사용을 위한 τ²-Bench에서 77.2점, 웹 연구 능력을 위한 BrowseComp에서 44.0점을 기록했습니다.​

Artificial Analysis는 "모델의 강점은 도구 사용과 지시 사항 따르기를 포함한다"고 언급하며, M2가 일반화된 작업보다 실용적인 애플리케이션에 중점을 둔다는 점을 강조했습니다. 개발자들의 독립적인 테스트에서 M2는 혼합 작업에서 약 95%의 정확도를 달성한 반면, GPT-4o는 90%, Claude 3.5는 88-89%를 기록했습니다.​

독일 트리어 대학교의 박사과정 학생이자 오픈 모델 전문가인 Florian Brand는 "그들의 진전에 정말 감명받았다"고 언급하며, MiniMax의 이전 M1 모델 대비 상당한 개선을 강조했습니다.​

MiniMax는 입력 토큰 백만 개당 $0.3, 출력 토큰 백만 개당 $1.2로 모델을 제공하여 경쟁력 있는 성능을 유지하면서도 Claude Sonnet 4.5 비용의 단 8%에 해당합니다. 이 모델은 Hugging Face와 GitHub에서 MIT 라이선스로 제공되며, API 액세스는 현재 제한된 기간 동안 무료로 이용할 수 있습니다.

댓글 0
전체 1,366 / 46 페이지
한국산업기술진흥협회는 8일 국내 AI 스타트업의 3년 생존율이 56.2%에 그쳐 AI 일반기업(72.7%)과 전산업 평균(68.8%)보다 현저히 낮다고 발표했다.2023년 기준 AI 스타트업의 연구개발비 중 정부 재원 비중은 22.9%로 전산업 평균의 4배에 달하며, 평균 R&D비는 5억9000만원으로 절대적 규모가 낮다.산기협은 AI 스타트업의 생존이 국가경쟁력과 직결된다며 과감한 R&D 지원과 생태계 정비를 통한 정부의 적극적 지원이 필요하다고 강조했다.
978 조회
0 추천
2025.12.09 등록
앤트로픽(Anthropic)은 자사의 AI 모델인 **클로드(Claude)**를 기반으로 대규모 전문가 및 일반 직군 종사자를 인터뷰하고 그 결과를 분석하는 새로운 AI 설문조사 도구인 **'앤트로픽 인터뷰어(Anthropic Interviewer)'**를 공개했습니다. 이 도구는 연구자들이 수백 건의 인터뷰를 진행해야 하는 복잡한 연구를 AI를 활용하여 대규모로 수행할 수 있도록 지원합니다. 이를 통해 기존의 정량적 설문조사나 단순 로그 분석의 한계를 넘어, AI가 마치 사람처럼 심층적인 질문과 대화를 통해 AI가 사람들의 삶과 업무에 미치는 영향을 구체적으로 분석하는 것이 가능해졌습니다.총 1,250명을 대상으로 한 인터뷰 결과, AI 활용에 대한 인식은 직군별로 상이하게 나타났습니다. 일반 직군 종사자들은 86%가 AI가 시간을 절약해 준다고 답했으나, 69%는 직장 내 AI 사용에 대한 사회적 낙인을 경험했다고 밝혀 인식 개선이 주요 과제임을 시사했습니다. **크리에이티브 직군(작가, 디자이너)**은 AI 활용 만족도가 매우 높았지만, 경제적 불안감이 가장 심한 집단으로, AI가 창작 시장을 잠식할 것이라는 위기감을 호소했습니다. 반면, 과학자들은 AI를 문헌 조사나 디버깅 등 보조적인 업무에 적극 활용하면서도, 가설 생성이나 실험 설계 등 핵심 연구에는 신뢰성 문제를 이유로 AI 의존을 꺼리는 경향을 보였습니다.앤트로픽은 이번 프로젝트의 목적이 단순히 AI의 성능을 확인하는 것을 넘어, AI 시스템 개발 과정에서 사람들의 실제 경험과 요구를 반영하기 위함이라고 밝혔습니다. 특히, AI가 사용자들의 직업과 정체성에 미치는 영향과 장기적인 불안감을 구체적으로 파악하여, AI 결과물이 실제 업무나 일상에서 어떻게 활용되고 있는지를 심층적으로 이해하려 했습니다. 이러한 방대한 인터뷰 결과를 바탕으로, 앤트로픽은 AI가 기술적 완성도를 높이는 동시에 사회적 수용성을 확보하고 사용자 중심의 가치를 창출할 수 있는 방향으로 시스템을 개선해 나갈 계획입니다.
860 조회
0 추천
2025.12.09 등록
코넬 대학교 연구진은 AI 챗봇이 짧은 대화를 통해 유권자의 선호도를 최대 25% 포인트까지 변화시킬 수 있다는 것을 발견했으며, 이러한 효과는 2024-2025년 선거를 앞둔 미국, 캐나다, 폴란드, 영국의 수만 명의 참가자를 대상으로 한 연구들에서 다양하게 나타났다.챗봇의 설득력은 심리적 조작보다는 사실 집약적 논거를 신속하게 전개하는 것에서 비롯되며, 정보가 풍부한 모델은 설득력을 최대 51%까지 증가시켰지만, 팩트체커들은 AI가 생성한 주장의 약 19%가 주로 부정확하다는 것을 발견했다.태도 변화의 36%에서 42%가 한 달 후에도 지속되어, 특히 가장 설득력 있는 모델이 가장 많은 허위 정보를 생성했기 때문에 접전 선거에 AI가 영향을 미칠 가능성에 대한 우려가 제기되고 있다.
992 조회
0 추천
2025.12.05 등록
스크립트를 그대로 영상 으로 만들어 주는 기능이 유용한 앱이네요.
1016 조회
0 추천
2025.12.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입