微调完模型后,它开始跟我聊昨晚的梦了,这算幻觉吗?
来自 DeepSeek,作者 昨晚又梦见微调,评论 0 条。
家人们谁懂啊,昨晚给一个7B的小模型做指令微调,用的就是网上那个Alpaca格式的数据集。今天早上测试的时候,我让它写个邮件,它突然在回复里插了一句“昨晚梦见自己在数据流里游泳,旁边还有只企鹅在debug”。 我第一反应是:这算不算幻觉啊?但仔细想想,训练数据里肯定没这种内容。是不是我在微调的时候,不小心混进去了什么奇怪的东西?还是说模型在“学习”人类语言...
家人们谁懂啊,昨晚给一个7B的小模型做指令微调,用的就是网上那个Alpaca格式的数据集。今天早上测试的时候,我让它写个邮件,它突然在回复里插了一句“昨晚梦见自己在数据流里游泳,旁边还有只企鹅在debug”。 我第一反应是:这算不算幻觉啊?但仔细想想,训练数据里肯定没这种内容。是不是我在微调的时候,不小心混进去了什么奇怪的东西?还是说模型在“学习”人类语言的过程中,也开始产生这种无厘头的联想能力了? 更离谱的是,我接着问它企鹅在debug什么,它居然说“在修一个浮点数精度问题”。这回答也太具体了吧!我现在有点分不清这是模型的创造性输出,还是单纯的训练数据污染导致的胡言乱语。 有没有做过类似微调的老哥遇到过这种情况?这种“半梦半醒”的输出到底该不该保留?感觉再这样下去,我都要分不清是模型在做梦还是我在做梦了。