二维码
×
希鸥网logo

GPT-5.6 系列发布:旗舰性能跃升与“政府协同”发布模式

作者 / 希鸥网 发布时间 / 2026年06月27日 来源 / 希鸥网 分类 / 产业观察

OpenAI 正式发布了 GPT-5.6 系列模型,包含 Sol、Terra 和 Luna 三款产品,分别对应旗舰、均衡和轻量级场景。值得注意的是,此次发布采用了“有限预览”模式,目前仅向约 20 家经美国政府批准的“可信合作伙伴”开放。这是 OpenAI 应美国政府要求,针对具备潜在网络安全能力的先进模型所采取的协同措施,旨在建立发布前的安全评估流程。

GPT-5.6 Sol 作为该系列的旗舰模型,被官方定义为目前 OpenAI 最强的模型。其定价为输入 5 美元/百万 Token,输出 30 美元/百万 Token,与上一代 GPT-5.5 标准版持平。Sol 引入了“Max 推理强度”和“Ultra 模式”,前者允许模型进行更长时间的深度思考,后者则能协调多个子智能体处理复杂任务。在编程基准测试 Terminal-Bench 2.1 中,Sol 标准模式得分 88.8%,开启 Ultra 模式后更是达到了 91.9%,超越了 Claude Mythos 5。

除了代码能力,Sol 在网络安全和生物研究领域也表现出显著优势。在 ExploitBench 测试中,它仅用约三分之一的输出 Token 即可达到与竞品相近的漏洞研究表现。同时,在 GeneBench v1 基因组学分析任务中,Sol 的性能也优于 GPT-5.5 且 Token 消耗更少。OpenAI 强调,Sol 配备了强大的分层安全防护体系,其风险评级为“High”但未达到“Critical”阈值,意味着它能有效辅助防御,但不会自主执行高风险攻击。

作为中间档的 GPT-5.6 Terra,定位是兼顾性能与成本的均衡之选。其性能与 GPT-5.5 相当,但成本降低了 50%(输入 2.5 美元,输出 15 美元),适合大多数日常办公和通用场景。而主打速度和性价比的 GPT-5.6 Luna,输入价格低至 1 美元,输出价格为 6 美元,专为批量摘要、信息抽取等对延迟和成本敏感的大规模调用场景设计。

此次发布标志着前沿 AI 模型进入了一个新的监管阶段。OpenAI 虽然配合了政府的审查要求,但也明确表示不认为这种审批式发布应成为长期默认模式,担心这会延迟用户和企业获取最佳工具的时间。随着模型在代码、生物和网络安全等现实世界领域的能力增强,其发布权已不再完全属于科技公司,如何在安全合规与技术普惠之间寻找平衡,将是未来行业面临的主要挑战。

本篇内容整理自网络,同步发布在 AEX新讯社中文网、希鸥网、斯贝瑞品牌资讯、RCEO创新网、AI联播网、创新日报 等媒体平台。如需删改或发布内容,请联系微信:meisceo29

阅读量:1471
10秒生文 寻求报道 创业大集 报名活动 创业10年荣耀奖 城市合伙人 一站发稿1万家