DeepSeek上线V4预览版模型，Pro版API开启限时2.5折价格战

2026-04-25

DeepSeek正式推出标配1M上下文的V4架构模型，通过对Pro版API施加激进的限时降价策略，进一步拉低Agent应用的规模化落地成本，并强制推进旧接口的生态交替。

核心API价格倒挂与旧接口淘汰

DeepSeek官方文档更新显示，deepseek-v4-pro 模型API正在进行“限时2.5折”特惠，窗口期截至北京时间2026年5月5日23:59。
具体折后计费标准（人民币/百万Tokens）：

生态变更信号：官方已明确宣告原核心接口名 deepseek-chat 与 deepseek-reasoner 将于日后彻底弃用。作为过渡，目前上述两个旧模型名已分别在后端强制重定向至下位替代品 deepseek-v4-flash 的非思考与思考模式。

V4模型在底层放弃了部分传统注意力机制，开创了在Token维度进行压缩的新型注意力机制，并结合DSA稀疏注意力（DeepSeek Sparse Attention）。该底层重构直接解决了长文本显存墙问题，将1M（一百万）上下文窗口由高配降维为DeepSeek全官方服务的“出厂标配”。

V4拆分为Pro与Flash双版本，其核心性能锚点发生转移：

DeepSeek-V4-Pro：核心提升在于Agent能力。内部实测反馈其Agentic Coding体验已超越Sonnet 4.5，代码交付质量逼近Opus 4.6的非思考模式。数理逻辑与竞赛代码超越目前所有公开开源模型，世界知识评测仅落后于Gemini-Pro-3.1。
DeepSeek-V4-Flash：主打极致性价比。基础推理能力紧咬Pro，但在复杂高难度Agent任务与冷门世界知识召回上存在物理差距。