OpenAI 现披露更多 o3-mini 模型的思考过程

为了应对包括中国AI公司DeepSeek在内的竞争压力，OpenAI正在改变其最新AI模型o3-mini的“思考过程”展示方式。

在周四的公告中，OpenAI表示，ChatGPT的免费和付费用户将能看到更新后的“思维链”，展示模型的“推理”步骤以及它如何得出问题答案。订阅高级ChatGPT计划的用户，在使用“高推理”配置的o3-mini时，也将看到这个更新的输出。

OpenAI发言人通过电子邮件告诉TechCrunch：“我们为o3-mini推出了更新的‘思维链’，旨在让用户更容易理解模型的思维方式。通过这个更新，您可以跟随模型的推理过程，从而更加清晰和有信心地理解它的回答。”

像o3-mini这样的推理模型在给出答案前会仔细进行事实核查，这有助于避免一些通常会使模型出错的问题。不过，这也意味着推理模型需要稍长的时间来得出结论，通常比其他模型多花几秒到几分钟。

DeepSeek的R1模型与o3-mini类似，是一种“推理”模型，能够展示完整的思考过程，许多AI研究人员认为这种方式更为理想。通过显示推理步骤，不仅让模型更容易研究，还能在某些情况下提供更好的用户体验，帮助判断模型是否在正确的轨道上。

OpenAI曾决定不展示o3-mini及其前身o1和o1-mini的完整推理步骤，部分原因是出于竞争考虑。相反，用户只能看到推理步骤的摘要，而这些摘要有时是错误的。

尽管如此，OpenAI并未完全展示o3-mini的推理步骤，但表示找到了一个“平衡点”：o3-mini可以“自由思考”，然后将其“思维”组织成更详细的摘要。

OpenAI发言人继续解释：“为了提高清晰度和安全性，我们增加了一个后处理步骤，模型会审查原始的思维链，去除任何不安全的内容，并简化复杂的想法。此外，这个后处理步骤还使得非英语用户可以用母语查看思维链，从而提供更加友好和可访问的体验。”

在上周的Reddit AMA中，OpenAI的首席产品官Kevin Weil暗示这一变化即将到来：“我们正在努力展示更多的内容——展示模型的思考过程会非常快到来。具体细节尚未确定——展示完整的思维链可能会导致竞争提炼，但我们知道用户（尤其是高级用户）希望看到它，所以我们会找到一个合适的平衡方式。”