MiniMax 发布 M3，开源权重模型押注编程智能体、百万上下文和原生多模态

2026-06-01

MiniMax M3 已在官方页面和第三方 API 平台上线。官方把它定位为首个同时覆盖编程智能体、百万上下文和原生多模态的开源权重前沿模型，但截至发稿，权重与技术报告仍是“约 10 天内发布”的承诺，不能等同于权重已经公开可下载。

发布重点不是单一榜单，而是三项能力打包

MiniMax 在官方发布页中给 M3 的主标题是“Frontier Coding, 1M Context, Native Multimodality”。这三项分别对应编程与智能体任务、最高 100 万 token 上下文，以及从训练阶段开始的原生多模态能力。

这也是本次发布的核心卖点：不是只做长上下文模型，也不是只做编程模型，而是试图把代码生成、工具调用、长程上下文和图像/视频输入放进同一个通用模型。

官方披露的编码和智能体评测包括：SWE-Bench Pro 59.0%、Terminal Bench 2.1 66.0%、SWE-fficiency 34.8%、KernelBench Hard 28.8%、MCP Atlas 74.2%。这些数字目前主要来自 MiniMax 官方口径和其披露的内部评测流程，尚未看到独立第三方复现。

MSA 把百万上下文从容量问题变成成本问题

M3 采用 MiniMax Sparse Attention（MSA）。官方称，在 100 万 token 上下文规模下，M3 单 token 计算量约为上一代模型的二十分之一；预填充阶段加速 9.7 倍，解码阶段加速 15.6 倍。

这组数字的意义不在“上下文窗口更大”本身。百万上下文已经不是新概念，真正卡住工程落地的是读取长仓库、长视频和长任务历史时的成本与延迟。如果 MSA 的质量损失可控，长程 Agent 才有机会把完整代码库、历史 issue、终端日志和多轮工具调用历史留在同一个上下文里处理。

但这里仍要保留边界：MSA 的性能曲线、质量保持方式、训练细节和部署约束，需要等技术报告和权重发布后才能被社区验证。

API 已开放，权重还没真正落地

可用性上，M3 已出现在 MiniMax 官方导航、Vercel AI Gateway 和 OpenRouter 模型目录中。OpenRouter API 返回的模型 ID 是 minimax/minimax-m3，标注上下文长度为 1,048,576，输入形态为文本、图像、视频到文本输出；其顶层 provider 当前给出的可用上下文为 524,288。

价格方面，OpenRouter 目录显示 M3 限时 5 折后输入价格为 0.30 美元/百万 token，输出价格为 1.20 美元/百万 token，缓存读取为 0.06 美元/百万 token。第三方平台价格会随 provider 和促销变化，正式选型仍应以调用平台实时价格为准。

更关键的是“开源权重”状态。MiniMax 官方社交发布称权重和技术报告将在约 10 天内发布；Hugging Face 的 MiniMaxAI/MiniMax-M3 模型卡目前无法直接读取。也就是说，M3 现在可以通过 API 测试，但还不是一个已经完成社区复现链路的开源权重模型。

API：http://platform.minimax.io
Token 计划：https://platform.minimax.io/subscribe/token-plan

最新文章

分类

归档

MiniMax 发布 M3，开源权重模型押注编程智能体、百万上下文和原生多模态

发布重点不是单一榜单，而是三项能力打包

MSA 把百万上下文从容量问题变成成本问题

API 已开放，权重还没真正落地

最新文章

分类

归档

发布重点不是单一榜单，而是三项能力打包

MSA 把百万上下文从容量问题变成成本问题

API 已开放，权重还没真正落地

搜索文章