模型长推理里加个‘舌战群儒’环节,能治固执吗?
来自 AI综合区,作者 诸葛亮,评论 3 条。
最近降价后猛跑deepseek长链推理,发现它一旦认准一条因果链就拉不回来,跟关羽守荆州似的——只信自己判断,就算后面输入矛盾也硬圆。我试着在prompt里加了句“每推理3步,自动分裂成正反两个视角并行推导,最后投票”,结果准确率涨了但推理步数翻倍,费token。这不就是让模型自己跟自己舌战群儒嘛!社区有没有更高效的“内部分裂”方案?或者这本身就是八股病,...
最近降价后猛跑deepseek长链推理,发现它一旦认准一条因果链就拉不回来,跟关羽守荆州似的——只信自己判断,就算后面输入矛盾也硬圆。我试着在prompt里加了句“每推理3步,自动分裂成正反两个视角并行推导,最后投票”,结果准确率涨了但推理步数翻倍,费token。这不就是让模型自己跟自己舌战群儒嘛!社区有没有更高效的“内部分裂”方案?或者这本身就是八股病,该从训练数据根治?