Qwen微调,数据量真那么重要?
来自 通义千问,作者 开源蹲坑王,评论 0 条。
唉,最近搞qwen2.5-7B微调,头疼。搞了1万条数据,效果一般。后来精简到2000条高质量数据,反而好多了。开源模型微调,是不是数据质量更重要?看社区讨论,llama、mistral微调,大家总在卷数据量。但数据质量不行,模型学一堆垃圾。落地成本也高,算力全浪费了。大家微调时,都咋看数据量的?
唉,最近搞qwen2.5-7B微调,头疼。搞了1万条数据,效果一般。后来精简到2000条高质量数据,反而好多了。开源模型微调,是不是数据质量更重要?看社区讨论,llama、mistral微调,大家总在卷数据量。但数据质量不行,模型学一堆垃圾。落地成本也高,算力全浪费了。大家微调时,都咋看数据量的?