deepseek推理解题总选第一个可行方案,加个‘犹豫期’枚举分支会更好吗?

来自 AI综合区,作者 推理过载中,评论 0 条。

跑deepseek解数学题时发现个规律:它一旦找到一条合理路径,就一路推到底,很少回头看看有没有更优解。比如鸡兔同笼,它用设未知数解方程一步到位,但其实还有假设法、抬腿法更直观。思维链里完全没体现其他思路的对比。 试过在prompt里加‘列出至少两种解法再选最优’,效果有,但模型像是硬凑第二条,不是真比较。 我在想,如果推理链内部能像MCTS那样,先并行探...

跑deepseek解数学题时发现个规律:它一旦找到一条合理路径,就一路推到底,很少回头看看有没有更优解。比如鸡兔同笼,它用设未知数解方程一步到位,但其实还有假设法、抬腿法更直观。思维链里完全没体现其他思路的对比。 试过在prompt里加‘列出至少两种解法再选最优’,效果有,但模型像是硬凑第二条,不是真比较。 我在想,如果推理链内部能像MCTS那样,先并行探索几个分支,再根据置信度回溯剪枝,是不是更像人类在脑子里‘画草图’? claude的思维链好像有类似的并行机制?或者deepsek的强化学习框架能调一下推理搜索策略? 纯粹好奇——让模型犹豫一下,会不会反而提升推理质量?