隆重推出GPT-5

我们迄今为止最智能、最快捷、最实用的模型,内置先进算法,让专业级智能触手可及。我们隆重推出 GPT‑5,这是我们迄今为止最先进的 AI 系统。GPT‑5 相较于我们之前的模型,在智能水平上实现了重大飞跃,其在编程、数学、写作、医疗、视觉感知等多个领域均展现出领先的性能。这是一个统一的系统,能够智能判断何时需要快速响应,何时需要深入思考,从而提供专家级别的回答。

统一的系统

GPT‑5 是一个统一系统,包含一个智能高效的模型,能够回答大多数问题;一个更深入的推理模型(GPT‑5 Thinking),用于解决更复杂的问题;以及一个实时路由器,能够根据对话类型、复杂度、工具需求以及您的明确意图(例如,如果您在提示中说“认真思考这个问题”)快速决定使用哪个模型。路由器会持续基于真实信号进行训练,包括用户切换模型、对回复的偏好率以及测量准确性,并随着时间的推移不断优化。当达到使用限制时,每个模型的精简版本将处理剩余的查询。在不久的将来,我们计划将这些功能整合到一个单一模型中。

一个更智能、更广泛适用的模型

GPT‑5 不仅在基准测试中表现优于前代模型,回答问题也更快,但最重要的是,它在处理现实世界查询时更加实用。我们在减少幻觉、提升指令遵循能力以及减少阿谀奉承方面取得了显著进展,同时在 ChatGPT 最常见的三个应用场景中提升了 GPT‑5 的性能:写作、编程和医疗。

编码

GPT‑5 是我们迄今为止最强大的编码模型。它在复杂的前端生成调试大型代码库方面表现出显著提升。它能够仅凭一个提示,以直观且富有美感的方式,将创意转化为现实,创建出美观且响应迅速的网站、应用和游戏,展现出对美感的敏锐把握。早期测试者还注意到了其设计选择,对间距、字体和留白等元素有了更深入的理解。点击此处查看 GPT‑5 为开发人员解锁的完整细节。

创意表达与写作

GPT‑5 是我们迄今为止最强大的写作助手,能够帮助您将粗略的想法转化为富有文学深度和节奏感的引人入胜的文字。它能够更可靠地处理涉及结构模糊性的写作,例如维持不押韵的抑扬五步格或自然流畅的自由体诗,将对形式的尊重与表达的清晰度相结合。这些提升的写作能力意味着 ChatGPT 在协助您完成日常任务时表现更佳,例如起草和编辑报告、邮件、备忘录等。GPT‑5 与 GPT‑4o 的写作风格对比见下表。

医疗保健

GPT‑5 是我们迄今为止针对医疗保健相关问题表现最佳的模型,它能帮助用户获取健康知识并更好地维护自身健康权益。该模型在我们今年早些时候基于真实场景和医生定义的标准发布的评估工具 HealthBench 上,得分显著高于以往任何模型。与之前模型相比,它更像一个积极的思维伙伴,会主动标记潜在问题并提出问题,以提供更具帮助性的答案。该模型现在能够提供更精准、更可靠的回复,能够根据用户的背景信息、知识水平和地理位置进行调整,从而在各种场景下提供更安全、更有帮助的回复。重要的是,ChatGPT 并不能替代医疗专业人员——可以将其视为一个合作伙伴,帮助您理解结果、在与医疗提供者交流时提出正确的问题,并在做出决策时权衡各种选项。

评估

GPT‑5 在各方面都表现得更加智能,这一点在其在学术和人类评估的基准测试中的表现中得到了体现,尤其是在数学、编程、视觉感知和医疗保健领域。它在数学(在 AIME 2025 测试中无需工具即可达到 94.6%)、现实世界编程(在 SWE-bench 验证测试中达到 74.9%,在 Aider-Polyglot 测试中达到 88%)、多模态理解(在 MMMU 测试中达到 84.2%)和医疗保健(在 HealthBench Hard 测试中达到 46.2%)等领域均树立了新的行业标杆——这些提升在实际应用中也得到了体现。凭借 GPT‑5 Pro 的扩展推理能力,该模型还在 GPQA 上创下了新纪录,没有工具情况下得分 88.4%。

OpenAI 推出ChatGPT Edu团购版价格更划算

X