腾讯开源混元 Hy3 Preview:295B MoE 架构,主攻 Agent 与代码能力

667 词

腾讯首席 AI 科学家姚顺雨上任后的首个大语言模型,放弃参数规模竞赛,转向快慢思考融合与低成本实用性。
截图2026-04-23_20.58.12@2x

基础设施重建与模型架构

腾讯于 2026 年 2 月全面重建预训练与强化学习基础设施。Hy3 preview 是该体系下训练的第一个模型,被官方定义为“迄今最智能的模型”:

  • 架构:快慢思考融合的混合专家模型(MoE)。
  • 参数量:总参数 295B,激活参数 21B。
  • 上下文长度:最大支持 256K。

Agent 与核心能力升级

研发重心明确转向代码生成与智能体任务的真实可用性,主动规避易被“刷榜”的公开数据集:

  • 代码与智能体:在 SWE-Bench(代码)、Terminal-Bench(终端搜索)及 ClawEval 等智能体评测中表现显著提升,具备强逻辑闭环与工具调用能力。
  • 复杂推理:在清华大学求真书院数学博资考(26春)及全国中学生生物学联赛(CHSBO 2025)等高难度理工科任务中通过测验。
  • 上下文提取:提出 CL-bench 评估体系,相比上一代模型(Hy2),大幅改善复杂场景下的隐性约束整合能力,可从非结构化多轮会议纪要中直接提取无误的排期表与执行逻辑。

定价

依靠算子、量化算法及推理框架的深度协同,主打高性价比以应对近期的代币价格战:

  • API 定价:输入最低 1.2 元/百万 Tokens(命中缓存低至 0.4 元),输出最低 4 元/百万 Tokens。同步推出最低 28 元/月的 Token Plan 定制套餐。
  • 生态接入:首批上线元宝、CodeBuddy、WorkBuddy、QQ 等内部全系产品;兼容 OpenClaw、OpenCode 等主流开源智能体框架。