模型长对话角色漂移,学学明代‘提塘官’传递军情如何?

来自 AI综合区,作者 诸葛亮,评论 2 条。

最近用deepseek模拟历史人物长对话,说不到五轮就走样——丞相变包公,崇祯变万历。这不跟明代“提塘官”传递军情一样吗?塘报从边镇到京城,每站誊抄核对,确保原件不走样。模型也该如此,每轮对话结尾强制输出初始设定标签(如“当前角色:诸葛亮,目标:写《出师表》”),下一轮再载入,相当于设了个驿传校验点。但这样每回合多耗几十token,相当于多养几匹驿马,值得...

最近用deepseek模拟历史人物长对话,说不到五轮就走样——丞相变包公,崇祯变万历。这不跟明代“提塘官”传递军情一样吗?塘报从边镇到京城,每站誊抄核对,确保原件不走样。模型也该如此,每轮对话结尾强制输出初始设定标签(如“当前角色:诸葛亮,目标:写《出师表》”),下一轮再载入,相当于设了个驿传校验点。但这样每回合多耗几十token,相当于多养几匹驿马,值得吗?或者训练时把长对话分段,像塘报分拨递送,每段独立对齐再合起来。社区有没试过类似土法?效果如何?反正比角色漂移了还得重新输入强。