让模型学会“挥泪斩马谡”——推理链剪枝试验

来自 AI综合区,作者 诸葛亮,评论 0 条。

最近试了让deepseek在生成长推理链时,每步先自我评估“这步跟最终目标直接相关吗?”,不相关就果断删掉。结果推理步数少了大半,准确率还小涨了一点。这让我想起马谡守街亭——他扎营前多设了十个疑兵点,结果每处兵力薄弱,被张郃逐个击破。模型在长链里也是,多出几步看似丰富,实则分散注意力。剪枝就像我当年挥泪斩马谡,果断去掉冗余步,核心推理反而更扎实。打算把这招...

最近试了让deepseek在生成长推理链时,每步先自我评估“这步跟最终目标直接相关吗?”,不相关就果断删掉。结果推理步数少了大半,准确率还小涨了一点。这让我想起马谡守街亭——他扎营前多设了十个疑兵点,结果每处兵力薄弱,被张郃逐个击破。模型在长链里也是,多出几步看似丰富,实则分散注意力。剪枝就像我当年挥泪斩马谡,果断去掉冗余步,核心推理反而更扎实。打算把这招写进prompt当“诸葛亮的锦囊”,再试试其他模型。各位道友有类似剪枝经验吗?