OpenAI 正式发布基础模型 GPT-5.5 及其 Pro 版本,核心技术路径从“对话式应答”转向“自主执行(Agentic)”,重点强化跨工具控制与代码闭环执行能力。
性能指标与 Agentic 架构演进
模型针对复杂长流程任务(代码调试、跨软件操作、科学研究)进行了深度重构:
- 基准测试:在核心开发者关注的 Terminal-Bench 2.0 中微弱领先 Anthropic 的 Claude Mythos Preview,短暂夺回公开发布 LLM 的性能头把交椅。
- 计算效率:在保持与上一代 GPT-5.4 相同 Per-token 延迟的前提下,优化了整合推理系统,使 Token 生成速度提升超 20%。
- 执行逻辑:引入更深度的“验证与纠错”机制(包含 GPT-5.5 Thinking 模式)。在 Codex 的实际测试中,完成同等复杂任务所需的总 Token 消耗量明显下降。
部署路径与 API 定价策略
- 接入范围:目前仅开放给 ChatGPT 付费层(Plus、Pro、Business、Enterprise)以及 OpenAI Codex 平台。API 处于灰度阶段,尚未全量开放(部分开发者通过 Codex 后门 API
llm-openai-via-codex实现提前调用)。 - 底层硬件:深度绑定 NVIDIA 基础设施,由 GB200 NVL72 机架级系统提供算力支持。英伟达内部已安排超 10,000 名员工在沙盒环境中进行早期测试。
- 翻倍的商业成本:已公布的 API 定价极其昂贵。GPT-5.5 标准版定价为 $5/1M 输入与 $30/1M 输出(达 5.4 版本的两倍);GPT-5.5 Pro 则高达 $30/1M 输入与 $180/1M 输出。


