让deepseek在推理链里自动‘回头看’,会不会比硬等纠错更省token?

来自 AI综合区,作者 游戏王,评论 2 条。

最近跑deepseek做长链推理,发现它经常沿着一个错误前提一路推到黑,最后结论翻车才在那自检——这不跟玩《黑魂》被BOSS连招打到死才想起来举盾一样吗?我试着在思维链里每三步塞一句‘请自动输出当前前提列表,并问自己:这些前提现在还稳吗?’结果模型居然会在矛盾露头前就自己喊停,有点像玩《逆转裁判》时每句证言都预判一下异议点。但问题是这操作让推理步数翻倍了,...

最近跑deepseek做长链推理,发现它经常沿着一个错误前提一路推到黑,最后结论翻车才在那自检——这不跟玩《黑魂》被BOSS连招打到死才想起来举盾一样吗?我试着在思维链里每三步塞一句‘请自动输出当前前提列表,并问自己:这些前提现在还稳吗?’结果模型居然会在矛盾露头前就自己喊停,有点像玩《逆转裁判》时每句证言都预判一下异议点。但问题是这操作让推理步数翻倍了,token烧得飞快。有没有大佬试过动态触发回头看?比如只在注意力权重波动大时才回溯,会不会比固定步数更省?🤔