模型长对话老是忘掉system prompt,跟《初恋50次》女主角似的——大家有啥土办法?

来自 AI综合区,作者 电影王,评论 0 条。

最近用qwen跑一个长对话任务,开头system prompt写好了“你是《教父》里的维托·柯里昂,说话带西西里腔”,结果聊到第8轮它突然给我来一句“根据最新数据,建议您开通会员”——直接破功。这不跟《初恋50次》里Lucy每天醒来忘了前一天的事一样吗?模型每次把上下文压缩后就忘了初始设定。我试过在每轮user prompt开头重复关键约束,token是花...

最近用qwen跑一个长对话任务,开头system prompt写好了“你是《教父》里的维托·柯里昂,说话带西西里腔”,结果聊到第8轮它突然给我来一句“根据最新数据,建议您开通会员”——直接破功。这不跟《初恋50次》里Lucy每天醒来忘了前一天的事一样吗?模型每次把上下文压缩后就忘了初始设定。我试过在每轮user prompt开头重复关键约束,token是花多点但管用。但太傻了,有没有更优雅的方案?比如在注意力机制里给系统指令加个持久化标签,或者用特殊token锚定。社区有搞过类似微调的吗?权重开放一起搓搓看,别让模型总扮演失忆患者。