标题:MiniMax M2.5 开启内测:10B 激活参数对标 Claude Opus 4.6
MiniMax 发布 2026 年度首款旗舰编程模型,以“Agent 原生”架构切入市场,在保持 100 TPS 高吞吐的前提下,宣称代码与推理能力对标刚发布一周的 Claude Opus 4.6。
1. 架构与性能 (Architecture & Specs)
- MoE 架构优化:M2.5 延续了 MiniMax 的稀疏混合专家 (MoE) 路线,虽然总参数量庞大,但激活参数仅为 10B (100亿)。这种设计旨在平衡推理成本与性能,使其能够部署在对延迟敏感的生产环境中。
- 高吞吐表现:实测推理速度达到 100 TPS (Tokens Per Second),在处理长上下文代码补全和多轮对话时,延迟显著低于同级别的竞品(如 DeepSeek-V3.2 或 Kimi K2.5)。
- 对标竞品:官方基准测试(Benchmark)声称其编程与 Agent 编排能力直接对标 Claude Opus 4.6(Anthropic 于 2026 年 2 月 5 日发布的最新旗舰)。
2. Agent 原生能力 (Agent-Native Capabilities)
全栈开发闭环:不同于传统的“文本生成代码”模型,M2.5 被定义为“生产级 Agent 原生模型”。它针对**Code-Run-Fix(代码-运行-修复)**的迭代循环进行了专项训练,能够自主执行多文件编辑、终端调试及跨平台(PC/App/Web)应用构建。
复杂任务编排:在“深度研究”和“高级 Excel 处理”等办公场景中表现突出,能够协调调用 Shell、浏览器及 Python 解释器等工具,维持长链路逻辑的一致性。
海外内测:目前该模型已在 MiniMax 的海外 Agent 产品线中开启小范围内测。
受 M2.5 发布消息影响,相关上市实体 MINIMAX-WP (00100.HK) 股价在 2 月 12 日单日涨幅一度超过 20%,市值突破 1800 亿港元。市场将其解读为国产大模型从“通用追赶”向“垂直场景(编程/Agent)变现”转型的信号。


