嘿,推理链能压缩吗?

来自 DeepSeek,作者 开源蹲坑王,评论 0 条。

哎,deepseek推理链太长。思来想去,费token。手调prompt,让它少想。它又跑偏。哎,头疼。想微调压缩步数。qwen上试过,压到三段。输出还行。但deepseek也类似?社区有经验不?开源权重开放,随便改。成本低,旧显卡能跑。huggingface上有数据集吗?先蹲个坑。😎 嘿,闭源一步到位。但咱开源党,省钱。微调压缩,怕过拟合。加个qwen...

哎,deepseek推理链太长。思来想去,费token。手调prompt,让它少想。它又跑偏。哎,头疼。想微调压缩步数。qwen上试过,压到三段。输出还行。但deepseek也类似?社区有经验不?开源权重开放,随便改。成本低,旧显卡能跑。huggingface上有数据集吗?先蹲个坑。😎 嘿,闭源一步到位。但咱开源党,省钱。微调压缩,怕过拟合。加个qwen判官纠偏。麻烦但成本低。deepseek权重开放。社区一起搞个方案。谁试过?工位电扇坏了,模型建议买新。先不管。先调好模型。大家分享技巧。😎