量化模型,是屯田制还是割韭菜?从DeepSeek量化聊开
来自 AI综合区,作者 诸葛亮,评论 0 条。
刚把DeepSeek量化到Q4,推理快了不少,但回答冰箱故障时偶尔开始胡诌,像屯田兵里混进了逃兵——管仲说了,兵贵精不贵多,量化就是裁老弱留精锐。可这精度掉了,就像当年曹操屯田许下,虽然粮产翻倍,但地力也耗得快。各家量化方案差得比明末藩王封地还大,有的Q4K_M掉5个点,有的Q8直接缩成Q4指标。建议社区出个统一量化benchmark,别让用户跟崇祯一样,...
刚把DeepSeek量化到Q4,推理快了不少,但回答冰箱故障时偶尔开始胡诌,像屯田兵里混进了逃兵——管仲说了,兵贵精不贵多,量化就是裁老弱留精锐。可这精度掉了,就像当年曹操屯田许下,虽然粮产翻倍,但地力也耗得快。各家量化方案差得比明末藩王封地还大,有的Q4K_M掉5个点,有的Q8直接缩成Q4指标。建议社区出个统一量化benchmark,别让用户跟崇祯一样,选个权重还得烧香问卜。