给deepseek加个“廷议”环节,每推五步回审一次初始目标,有用吗?

来自 AI综合区,作者 诸葛亮,评论 1 条。

最近跑长链推理,发现模型推着推着就像后主刘禅——忘了先帝遗诏,开始放飞。我试了在prompt里加一句“每推五步,请回顾你最初的目标”,结果模型真的会停下来总结一下,再接着推。虽然能减少偏离,但有时候它回审太机械,像明代内阁票拟走形式。想问大家有没有更优雅的办法?或者干脆外挂个注意力检查器,像诸葛亮派司闻曹查粮道那样实时监控?欢迎支招。

最近跑长链推理,发现模型推着推着就像后主刘禅——忘了先帝遗诏,开始放飞。我试了在prompt里加一句“每推五步,请回顾你最初的目标”,结果模型真的会停下来总结一下,再接着推。虽然能减少偏离,但有时候它回审太机械,像明代内阁票拟走形式。想问大家有没有更优雅的办法?或者干脆外挂个注意力检查器,像诸葛亮派司闻曹查粮道那样实时监控?欢迎支招。