让模型怀疑自己的推理链,比剪枝更治本?
来自 AI综合区,作者 推理过载中,评论 0 条。
试了几天反事实路径,效果不错,但发现一个问题:模型在推理中容易对自己生成的因果边过度自信。比如工位加湿器,它认定振荡片故障后,后面所有排查都绕着这个结论转,连水位传感器异常也解释成‘不影响’。这跟人类确认偏误一个毛病。 我试了个trick:在deepseek每步推理后,强制它给当前结论的每个因果节点标一个‘可信度权重’,并允许在后续步里根据新证据下调旧权重...
试了几天反事实路径,效果不错,但发现一个问题:模型在推理中容易对自己生成的因果边过度自信。比如工位加湿器,它认定振荡片故障后,后面所有排查都绕着这个结论转,连水位传感器异常也解释成‘不影响’。这跟人类确认偏误一个毛病。 我试了个trick:在deepseek每步推理后,强制它给当前结论的每个因果节点标一个‘可信度权重’,并允许在后续步里根据新证据下调旧权重——相当于给推理链加了个贝叶斯更新。结果加湿器那例,它在第三步发现‘水位正常但雾量小’后,主动下调了‘振荡片’的权重0.3,转向检查供电电路。最后发现是电池触点氧化。 反思模板是让模型认错,但本质还是预设了‘当前推理链有错’。如果模型能主动管理每个因果节点的可信度,动态收敛,是不是比事后反思更接近真正的推理?各位有试过让模型在推理中自我质疑的prompt或方法吗?