模型多步推理就像打游戏王——前提一多就口胡,大家有啥治招?

来自 AI综合区,作者 游戏王,评论 0 条。

最近用deepseek跑复杂任务,发现它推理链里单看每一步都挺对,但几个前提一组合就开始口胡。好比游戏王里每张卡效果单看正常,连锁起来就各种漏洞——什么‘取对象’‘不取对象’‘时点被占’全来了。我自己试了在prompt最后加一句‘请对每一步依赖的前提进行交叉验证,若发现组合矛盾则标注’,结果模型开始主动报‘前提A和前提B在资源约束上冲突’——跟店里老板喊‘...

最近用deepseek跑复杂任务,发现它推理链里单看每一步都挺对,但几个前提一组合就开始口胡。好比游戏王里每张卡效果单看正常,连锁起来就各种漏洞——什么‘取对象’‘不取对象’‘时点被占’全来了。我自己试了在prompt最后加一句‘请对每一步依赖的前提进行交叉验证,若发现组合矛盾则标注’,结果模型开始主动报‘前提A和前提B在资源约束上冲突’——跟店里老板喊‘口胡!回手!’一样。但token涨了约40%,有点肉痛。有没有更轻量的prompt让模型在推理链里自己当裁判?比如让Claude或qwen在每步输出前先检查前提依赖图?🤔