GPT-5.6 系列发布：旗舰性能跃升与“政府协同”发布模式

OpenAI 正式发布了 GPT-5.6 系列模型，包含 Sol、Terra 和 Luna 三款产品，分别对应旗舰、均衡和轻量级场景。值得注意的是，此次发布采用了“有限预览”模式，目前仅向约 20 家经美国政府批准的“可信合作伙伴”开放。这是 OpenAI 应美国政府要求，针对具备潜在网络安全能力的先进模型所采取的协同措施，旨在建立发布前的安全评估流程。

GPT-5.6 Sol 作为该系列的旗舰模型，被官方定义为目前 OpenAI 最强的模型。其定价为输入 5 美元/百万 Token，输出 30 美元/百万 Token，与上一代 GPT-5.5 标准版持平。Sol 引入了“Max 推理强度”和“Ultra 模式”，前者允许模型进行更长时间的深度思考，后者则能协调多个子智能体处理复杂任务。在编程基准测试 Terminal-Bench 2.1 中，Sol 标准模式得分 88.8%，开启 Ultra 模式后更是达到了 91.9%，超越了 Claude Mythos 5。

除了代码能力，Sol 在网络安全和生物研究领域也表现出显著优势。在 ExploitBench 测试中，它仅用约三分之一的输出 Token 即可达到与竞品相近的漏洞研究表现。同时，在 GeneBench v1 基因组学分析任务中，Sol 的性能也优于 GPT-5.5 且 Token 消耗更少。OpenAI 强调，Sol 配备了强大的分层安全防护体系，其风险评级为“High”但未达到“Critical”阈值，意味着它能有效辅助防御，但不会自主执行高风险攻击。

作为中间档的 GPT-5.6 Terra，定位是兼顾性能与成本的均衡之选。其性能与 GPT-5.5 相当，但成本降低了 50%（输入 2.5 美元，输出 15 美元），适合大多数日常办公和通用场景。而主打速度和性价比的 GPT-5.6 Luna，输入价格低至 1 美元，输出价格为 6 美元，专为批量摘要、信息抽取等对延迟和成本敏感的大规模调用场景设计。

此次发布标志着前沿 AI 模型进入了一个新的监管阶段。OpenAI 虽然配合了政府的审查要求，但也明确表示不认为这种审批式发布应成为长期默认模式，担心这会延迟用户和企业获取最佳工具的时间。随着模型在代码、生物和网络安全等现实世界领域的能力增强，其发布权已不再完全属于科技公司，如何在安全合规与技术普惠之间寻找平衡，将是未来行业面临的主要挑战。

本篇内容整理自网络，同步发布在 AEX新讯社中文网、希鸥网、斯贝瑞品牌资讯、RCEO创新网、AI联播网、创新日报等媒体平台。如需删改或发布内容，请联系微信：meisceo29