月之暗面正式上线 Kimi K2.6,核心突破在于极高强度的自主编程执行力与最高支持 300 节点并行的 Agent 集群架构,标志着基础模型能力从“代码片段生成”向“系统级工程接管”过渡。
超长程自主编码 (Autonomous Coding)
- 基准测试数据:在内部代码评测集 Kimi Code Bench 中,K2.6 较上一代 K2.5 提升约 20%。官方宣称其代码能力基准对标 GPT-5.4。
- 无人值守执行极限:
- 旧系统重构:针对具有 8 年历史的开源金融撮合引擎(exchange-core),K2.6 连续运行 13 小时,发起 1000+ 次工具调用,完成 4000+ 行代码修改,最终将引擎中等吞吐量提升 185%,最高吞吐量提升 133%。
- 零样本语言学习与优化:在 Mac 本地环境,模型利用未曾进行专项训练的小众语言 Zig 优化 Qwen3.5-0.8B 的推理流。历时 12 小时、发起 4000 余次工具调用、自主迭代 14 个版本,将吞吐量从 15 tokens/s 提升至 193 tokens/s(较 LM Studio 竞品快 20%)。
Agent 集群架构升级 (Agent Swarm)
- 并发与调度调度:重构多 Agent 协同底层机制,最高支持 300 个子 Agent 在单个工程任务中并行运行。
- 任务深度拓宽:单次任务流最多可执行约 4000 个协作步骤,能够实现“全网深度搜索 -> 数据结构化 -> 网页端开发 -> PPT及报表生成”的跨模态产物一次性端到端交付。
- 多模态工程转化:结合升级后的视觉理解能力,支持通过单指令交付自带数据库与账号体系的专业级 Web 应用,并且优质的会话产物支持一键转化为专属 Skill 以沉淀为标准工作流。
部署与 API 状态
- 全量接入:已同步上线 Web 端、最新版 App、Kimi Code 编程助手及官方 API 平台。API 接口调用模型标识为
kimi-k2.6。 - 定价策略:API 定价为输入 ¥6.50/MTokens,输出 ¥27.00/MTokens,上下文缓存命中 ¥1.10/MTokens。
- 推理干预:API 提供显式的
thinking参数,开发者可强制开启或禁用长思考(CoT)模式。


