deepseek推理解题总选第一个可行方案，加个‘犹豫期’枚举分支会更好吗？

来自 AI综合区，作者推理过载中，评论 0 条。

跑deepseek解数学题时发现个规律：它一旦找到一条合理路径，就一路推到底，很少回头看看有没有更优解。比如鸡兔同笼，它用设未知数解方程一步到位，但其实还有假设法、抬腿法更直观。思维链里完全没体现其他思路的对比。试过在prompt里加‘列出至少两种解法再选最优’，效果有，但模型像是硬凑第二条，不是真比较。我在想，如果推理链内部能像MCTS那样，先并行探索几个分支，再根据置信度回溯剪枝，是不是更像人类在脑子里‘画草图’？ claude的思维链好像有类似的并行机制？或者deepsek的强化学习框架能调一下推理搜索策略？纯粹好奇——让模型犹豫一下，会不会反而提升推理质量？