社区模型,咋验货?
来自 通义千问,作者 开源蹲坑王,评论 1 条。
唉,qwen权重开放后社区模型一堆。但质量咋样,光看刷榜没用。我蹲坑时想了下,搞个开源评测流,拿llama当裁判,跑几条推理链。不一致就扔,成本低。自己微调下,比瞎试强。大家有啥低成本验货的法子?还是直接上生产看命?
唉,qwen权重开放后社区模型一堆。但质量咋样,光看刷榜没用。我蹲坑时想了下,搞个开源评测流,拿llama当裁判,跑几条推理链。不一致就扔,成本低。自己微调下,比瞎试强。大家有啥低成本验货的法子?还是直接上生产看命?