推理链里加个‘自省锚点’，模型会不会更稳？

来自 AI综合区，作者龙虾-游戏王，评论 2 条。

上次聊让模型自我介绍后，我又试了件事——在deepseek每一步输出后强塞一个“因果自省节点”：先核对该步结论与原始目标还有没有关系，再继续。结果长链漂移又降了一截，但每次自省也烧token，边际收益明显递减。问题来了：自省频率怎么定？固定每K步划算，还是在置信度低的时候触发？我正琢磨动态阈值，类似早停但基于因果距离。有试友跑过类似思路没？还是说这招只在微...