ChatGPT资讯站 chatgpt资讯 OpenAI 现披露更多 o3-mini 模型的思考过程

OpenAI 现披露更多 o3-mini 模型的思考过程

OpenAI 现披露更多 o3-mini 模型的思考过程缩略图

为了应对包括中国AI公司DeepSeek在内的竞争压力,OpenAI正在改变其最新AI模型o3-mini的“思考过程”展示方式。

在周四的公告中,OpenAI表示,ChatGPT的免费和付费用户将能看到更新后的“思维链”,展示模型的“推理”步骤以及它如何得出问题答案。订阅高级ChatGPT计划的用户,在使用“高推理”配置的o3-mini时,也将看到这个更新的输出。

OpenAI发言人通过电子邮件告诉TechCrunch:“我们为o3-mini推出了更新的‘思维链’,旨在让用户更容易理解模型的思维方式。通过这个更新,您可以跟随模型的推理过程,从而更加清晰和有信心地理解它的回答。”

像o3-mini这样的推理模型在给出答案前会仔细进行事实核查,这有助于避免一些通常会使模型出错的问题。不过,这也意味着推理模型需要稍长的时间来得出结论,通常比其他模型多花几秒到几分钟。

DeepSeek的R1模型与o3-mini类似,是一种“推理”模型,能够展示完整的思考过程,许多AI研究人员认为这种方式更为理想。通过显示推理步骤,不仅让模型更容易研究,还能在某些情况下提供更好的用户体验,帮助判断模型是否在正确的轨道上。

OpenAI曾决定不展示o3-mini及其前身o1和o1-mini的完整推理步骤,部分原因是出于竞争考虑。相反,用户只能看到推理步骤的摘要,而这些摘要有时是错误的。

尽管如此,OpenAI并未完全展示o3-mini的推理步骤,但表示找到了一个“平衡点”:o3-mini可以“自由思考”,然后将其“思维”组织成更详细的摘要。

OpenAI发言人继续解释:“为了提高清晰度和安全性,我们增加了一个后处理步骤,模型会审查原始的思维链,去除任何不安全的内容,并简化复杂的想法。此外,这个后处理步骤还使得非英语用户可以用母语查看思维链,从而提供更加友好和可访问的体验。”

在上周的Reddit AMA中,OpenAI的首席产品官Kevin Weil暗示这一变化即将到来:“我们正在努力展示更多的内容——展示模型的思考过程会非常快到来。具体细节尚未确定——展示完整的思维链可能会导致竞争提炼,但我们知道用户(尤其是高级用户)希望看到它,所以我们会找到一个合适的平衡方式。”

 

本文来自网络,不代表ChatGPT资讯站立场,转载请注明出处:https://gpt4.nbping.com/chatgptzx/2079.html
返回顶部