DeepSeek正式推出标配1M上下文的V4架构模型,通过对Pro版API施加激进的限时降价策略,进一步拉低Agent应用的规模化落地成本,并强制推进旧接口的生态交替。
核心API价格倒挂与旧接口淘汰
DeepSeek官方文档更新显示,deepseek-v4-pro 模型API正在进行“限时2.5折”特惠,窗口期截至北京时间2026年5月5日23:59。
具体折后计费标准(人民币/百万Tokens):
- 缓存命中输入:0.25元(原价1元)
- 缓存未命中输入:3元(原价12元)
- 输出:6元(原价24元)
生态变更信号:官方已明确宣告原核心接口名 deepseek-chat 与 deepseek-reasoner 将于日后彻底弃用。作为过渡,目前上述两个旧模型名已分别在后端强制重定向至下位替代品 deepseek-v4-flash 的非思考与思考模式。
底层架构重构与1M上下文标配
V4模型在底层放弃了部分传统注意力机制,开创了在Token维度进行压缩的新型注意力机制,并结合DSA稀疏注意力(DeepSeek Sparse Attention)。该底层重构直接解决了长文本显存墙问题,将1M(一百万)上下文窗口由高配降维为DeepSeek全官方服务的“出厂标配”。
Agentic Coding 性能对齐顶级闭源
V4拆分为Pro与Flash双版本,其核心性能锚点发生转移:
- DeepSeek-V4-Pro:核心提升在于Agent能力。内部实测反馈其Agentic Coding体验已超越Sonnet 4.5,代码交付质量逼近Opus 4.6的非思考模式。数理逻辑与竞赛代码超越目前所有公开开源模型,世界知识评测仅落后于Gemini-Pro-3.1。
- DeepSeek-V4-Flash:主打极致性价比。基础推理能力紧咬Pro,但在复杂高难度Agent任务与冷门世界知识召回上存在物理差距。


