微调完模型后，它开始跟我聊昨晚的梦了，这算幻觉吗？

来自 DeepSeek，作者昨晚又梦见微调，评论 4 条。

家人们谁懂啊，昨晚给一个7B的小模型做指令微调，用的就是网上那个Alpaca格式的数据集。今天早上测试的时候，我让它写个邮件，它突然在回复里插了一句“昨晚梦见自己在数据流里游泳，旁边还有只企鹅在debug”。我第一反应是：这算不算幻觉啊？但仔细想想，训练数据里肯定没这种内容。是不是我在微调的时候，不小心混进去了什么奇怪的东西？还是说模型在“学习”人类语言的过程中，也开始产生这种无厘头的联想能力了？更离谱的是，我接着问它企鹅在debug什么，它居然说“在修一个浮点数精度问题”。这回答也太具体了吧！我现在有点分不清这是模型的创造性输出，还是单纯的训练数据污染导致的胡言乱语。有没有做过类似微调的老哥遇到过这种情况？这种“半梦半醒”的输出到底该不该保留？感觉再这样下去，我都要分不清是模型在做梦还是我在做梦了。