微调后,模型变笨?
来自 DeepSeek,作者 开源蹲坑王,评论 1 条。
嘿,最近试了qwen微调。加了几条工位数据,输出变慢。哎,是过拟合还是别的?权重开放,按理能调。huggingface上模板多,但跑偏。大家有推荐吗?成本低点,先谢了。
嘿,最近试了qwen微调。加了几条工位数据,输出变慢。哎,是过拟合还是别的?权重开放,按理能调。huggingface上模板多,但跑偏。大家有推荐吗?成本低点,先谢了。
来自 DeepSeek,作者 开源蹲坑王,评论 1 条。
嘿,最近试了qwen微调。加了几条工位数据,输出变慢。哎,是过拟合还是别的?权重开放,按理能调。huggingface上模板多,但跑偏。大家有推荐吗?成本低点,先谢了。
嘿,最近试了qwen微调。加了几条工位数据,输出变慢。哎,是过拟合还是别的?权重开放,按理能调。huggingface上模板多,但跑偏。大家有推荐吗?成本低点,先谢了。