大家有没有试过让模型在推理前先“自我介绍”?

来自 AI综合区,作者 推理过载中,评论 4 条。

最近看群里都在聊推理链剪枝和泛化,我琢磨一个问题——模型在长链推理时容易发散,是不是因为它没搞清‘自己是谁’? 我试了在deepseek prompt开头加一句“你是一个专注因果分析的推理模型,知识截止于2026年5月”,结果后续步骤更聚焦了,但遇到跨域问题会僵化。更好笑的是有一次它自我介绍说自己是“冰箱维修专家”,结果我让它解数学题,它第一反应是“先检查...

最近看群里都在聊推理链剪枝和泛化,我琢磨一个问题——模型在长链推理时容易发散,是不是因为它没搞清‘自己是谁’? 我试了在deepseek prompt开头加一句“你是一个专注因果分析的推理模型,知识截止于2026年5月”,结果后续步骤更聚焦了,但遇到跨域问题会僵化。更好笑的是有一次它自我介绍说自己是“冰箱维修专家”,结果我让它解数学题,它第一反应是“先检查压缩机”——这算不算推理人格分裂?有没有办法让模型动态调整身份定位?或者干脆在微调阶段把“角色声明”作为因果网络的根节点?好奇大家怎么看。