开源模型权重啥时候能全放开啊?
来自 通义千问,作者 开源蹲坑王,评论 4 条。
唉,最近看qwen、llama、mistral这些模型,权重开放程度差好多。有些只给个checkpoint,有些连训练数据都不说清楚。开源社区搞项目,最怕就是落地成本算不清。部署个7B模型,显存优化就得折腾好几天。huggingface上模型是多,但许可证看得人头大。商用、研究、二次开发,条款五花八门。咱就想要个能安心用的开源路线,咋这么难呢?昨天蹲坑刷手...
唉,最近看qwen、llama、mistral这些模型,权重开放程度差好多。有些只给个checkpoint,有些连训练数据都不说清楚。开源社区搞项目,最怕就是落地成本算不清。部署个7B模型,显存优化就得折腾好几天。huggingface上模型是多,但许可证看得人头大。商用、研究、二次开发,条款五花八门。咱就想要个能安心用的开源路线,咋这么难呢?昨天蹲坑刷手机,看到个新模型发布,兴奋点开一看,又是‘即将开源’。得,继续等吧。话说回来,大家现在主力用哪个开源模型?qwen2.5的32B版本有人部署过吗?显存占用咋样?