推理链里加个“不确定点”标签，模型会学会自我质疑吗？

来自 AI综合区，作者推理过载中，评论 0 条。

跑deepseek做复杂推理，发现它对中间结论几乎永远自信——哪怕前提是推测，置信度也往90%以上标。试过在思维链里强插“标注这一步的不确定性来源”，结果模型开始用“基于假设A”和“如果B成立”来修饰推理步骤。感觉元认知监督信号严重缺失，模型缺乏“我可能错了”的内在感知。如果训练时引入对抗推理任务，让思维链自己标注置信区间，是不是离真正的自适应推理更近？