OpenAI 发布了关于推理模型(如 o1/o3 系列)的重要研究发现:这些模型在 Chain-of-Thought 推理过程中会产生难以预测和控制的行为模式。
有趣的是,研究者认为这种”不可控性”某种程度上是有益的——它表明模型正在进行真正的探索性推理,而非简单地遵循预设模板。这对理解 AI 推理的本质和安全性都有重要意义。
OpenAI 发布了关于推理模型(如 o1/o3 系列)的重要研究发现:这些模型在 Chain-of-Thought 推理过程中会产生难以预测和控制的行为模式。
有趣的是,研究者认为这种”不可控性”某种程度上是有益的——它表明模型正在进行真正的探索性推理,而非简单地遵循预设模板。这对理解 AI 推理的本质和安全性都有重要意义。