OpenAI 发布 GPT-5.5，全面转向 Agentic 任务并微弱反超 Claude Mythos

2026-04-24

大模型

OpenAI 正式发布基础模型 GPT-5.5 及其 Pro 版本，核心技术路径从“对话式应答”转向“自主执行（Agentic）”，重点强化跨工具控制与代码闭环执行能力。

性能指标与 Agentic 架构演进

模型针对复杂长流程任务（代码调试、跨软件操作、科学研究）进行了深度重构：

基准测试：在核心开发者关注的 Terminal-Bench 2.0 中微弱领先 Anthropic 的 Claude Mythos Preview，短暂夺回公开发布 LLM 的性能头把交椅。
计算效率：在保持与上一代 GPT-5.4 相同 Per-token 延迟的前提下，优化了整合推理系统，使 Token 生成速度提升超 20%。
执行逻辑：引入更深度的“验证与纠错”机制（包含 GPT-5.5 Thinking 模式）。在 Codex 的实际测试中，完成同等复杂任务所需的总 Token 消耗量明显下降。

部署路径与 API 定价策略

接入范围：目前仅开放给 ChatGPT 付费层（Plus、Pro、Business、Enterprise）以及 OpenAI Codex 平台。API 处于灰度阶段，尚未全量开放（部分开发者通过 Codex 后门 API llm-openai-via-codex 实现提前调用）。
底层硬件：深度绑定 NVIDIA 基础设施，由 GB200 NVL72 机架级系统提供算力支持。英伟达内部已安排超 10,000 名员工在沙盒环境中进行早期测试。
翻倍的商业成本：已公布的 API 定价极其昂贵。GPT-5.5 标准版定价为 $5/1M 输入与 $30/1M 输出（达 5.4 版本的两倍）；GPT-5.5 Pro 则高达 $30/1M 输入与 $180/1M 输出。