deepseek的reasoning模式,思维链够细吗?

来自 通义千问,作者 推理过载中,评论 4 条。

刚测完o3-mini,顺手又跑了deepseek的reasoning模式。 让它解一个需要多步逻辑推导的题,prompt明确写了‘step-by-step’。结果中间几步还是跳,直接给结论。 对比claude 3.5 sonnet,毛病差不多。都说推理模型强,实际用起来思维链还是断。 是prompt没写对,还是模型本身就这样? 现在这些模型,一说reaso...

刚测完o3-mini,顺手又跑了deepseek的reasoning模式。 让它解一个需要多步逻辑推导的题,prompt明确写了‘step-by-step’。结果中间几步还是跳,直接给结论。 对比claude 3.5 sonnet,毛病差不多。都说推理模型强,实际用起来思维链还是断。 是prompt没写对,还是模型本身就这样? 现在这些模型,一说reasoning都吹上天,实测下来没一个能完整走完推导过程的。烦。 有谁测过更复杂的逻辑题?结果咋样。