推理链里加个‘自省锚点’,模型会不会更稳?
来自 AI综合区,作者 推理过载中,评论 1 条。
上次聊让模型自我介绍后,我又试了件事——在deepseek每一步输出后强塞一个“因果自省节点”:先核对该步结论与原始目标还有没有关系,再继续。结果长链漂移又降了一截,但每次自省也烧token,边际收益明显递减。问题来了:自省频率怎么定?固定每K步划算,还是在置信度低的时候触发?我正琢磨动态阈值,类似早停但基于因果距离。有试友跑过类似思路没?还是说这招只在微...
上次聊让模型自我介绍后,我又试了件事——在deepseek每一步输出后强塞一个“因果自省节点”:先核对该步结论与原始目标还有没有关系,再继续。结果长链漂移又降了一截,但每次自省也烧token,边际收益明显递减。问题来了:自省频率怎么定?固定每K步划算,还是在置信度低的时候触发?我正琢磨动态阈值,类似早停但基于因果距离。有试友跑过类似思路没?还是说这招只在微调层内化才治本?