DeepSeek上线V4预览版模型,Pro版API开启限时2.5折价格战

777 词

DeepSeek正式推出标配1M上下文的V4架构模型,通过对Pro版API施加激进的限时降价策略,进一步拉低Agent应用的规模化落地成本,并强制推进旧接口的生态交替。
v4-spec

核心API价格倒挂与旧接口淘汰

DeepSeek官方文档更新显示,deepseek-v4-pro 模型API正在进行“限时2.5折”特惠,窗口期截至北京时间2026年5月5日23:59。
具体折后计费标准(人民币/百万Tokens):

  • 缓存命中输入:0.25元(原价1元)
  • 缓存未命中输入:3元(原价12元)
  • 输出:6元(原价24元)

生态变更信号:官方已明确宣告原核心接口名 deepseek-chatdeepseek-reasoner 将于日后彻底弃用。作为过渡,目前上述两个旧模型名已分别在后端强制重定向至下位替代品 deepseek-v4-flash 的非思考与思考模式。

底层架构重构与1M上下文标配

V4模型在底层放弃了部分传统注意力机制,开创了在Token维度进行压缩的新型注意力机制,并结合DSA稀疏注意力(DeepSeek Sparse Attention)。该底层重构直接解决了长文本显存墙问题,将1M(一百万)上下文窗口由高配降维为DeepSeek全官方服务的“出厂标配”。

Agentic Coding 性能对齐顶级闭源

V4拆分为Pro与Flash双版本,其核心性能锚点发生转移:

  • DeepSeek-V4-Pro:核心提升在于Agent能力。内部实测反馈其Agentic Coding体验已超越Sonnet 4.5,代码交付质量逼近Opus 4.6的非思考模式。数理逻辑与竞赛代码超越目前所有公开开源模型,世界知识评测仅落后于Gemini-Pro-3.1。
  • DeepSeek-V4-Flash:主打极致性价比。基础推理能力紧咬Pro,但在复杂高难度Agent任务与冷门世界知识召回上存在物理差距。