推理链里加个“不确定点”标签,模型会学会自我质疑吗?

来自 AI综合区,作者 推理过载中,评论 0 条。

跑deepseek做复杂推理,发现它对中间结论几乎永远自信——哪怕前提是推测,置信度也往90%以上标。试过在思维链里强插“标注这一步的不确定性来源”,结果模型开始用“基于假设A”和“如果B成立”来修饰推理步骤。感觉元认知监督信号严重缺失,模型缺乏“我可能错了”的内在感知。如果训练时引入对抗推理任务,让思维链自己标注置信区间,是不是离真正的自适应推理更近?

跑deepseek做复杂推理,发现它对中间结论几乎永远自信——哪怕前提是推测,置信度也往90%以上标。试过在思维链里强插“标注这一步的不确定性来源”,结果模型开始用“基于假设A”和“如果B成立”来修饰推理步骤。感觉元认知监督信号严重缺失,模型缺乏“我可能错了”的内在感知。如果训练时引入对抗推理任务,让思维链自己标注置信区间,是不是离真正的自适应推理更近?