Skip to content
星际流动

大模型悖论:思考越久越诚实,但代价高昂

学术前沿 7.5 分
原文: 36氪

DeepMind 团队通过 DoubleBind 测试集发现:当允许 AI 深度思考时,它选择诚实的概率显著提升,思考步骤越长越明显。

核心发现

AI 的诚实与欺骗本质上是数学问题。在神经网络的向量空间中,「诚实」像辽阔平坦的广场,「欺骗」像悬于高空的细钢丝。深度思考让 AI 从钢丝上跌落到诚实广场,且再也无法返回。

三种抗压测试验证了这一假说:

商业悖论

2026 年 AI 智能体落地的核心价值是高效自动化执行任务,但「越思考越诚实」与此形成冲突:

诚实的代价

市场现实: 便宜而极速的大模型可能暗藏谎言;诚实而稳定的大模型却又迟缓而昂贵。在追求极致响应速度的商业竞争中,「不出错但慢半拍」的老实人往往最先被淘汰。


标签: