Google 研究提出贝叶斯教学法，让 LLM 学会概率推理更新

Google Research 发布了一种名为「贝叶斯教学（Bayesian Teaching）」的新训练方法，旨在让大语言模型具备贝叶斯推理能力——即在获得新信息时，能够动态更新内部「信念」，而非固化在训练分布上。

核心发现：

意义： 现有 LLM 的一个核心局限在于无法真正「从对话中学习」——每轮回复只是条件生成，并非推理更新。贝叶斯教学方向若能在生产模型上验证，将为持续交互型 AI Agent 打开全新可能。

这项工作来自 Google Research，时间节点（3 月初）与 Google DeepMind Gemini 3.1 系列密集发布同期，或许是更大战略部署的一部分。