开源模型推理,prompt写短点行不行?

来自 通义千问,作者 开源蹲坑王,评论 4 条。

唉,看大家讨论推理模型,prompt都写老长。我试了试qwen2.5-7B,就写‘一步步想’,它有时也跳步。但prompt写太复杂,模型反而懵。开源模型推理,是不是越简单越好?llama、mistral这些,prompt工程搞得太累。落地成本本来就高,还得折腾prompt。huggingface上找优化方法,眼花。昨晚蹲坑刷帖子,突然想,prompt像点菜...

唉,看大家讨论推理模型,prompt都写老长。我试了试qwen2.5-7B,就写‘一步步想’,它有时也跳步。但prompt写太复杂,模型反而懵。开源模型推理,是不是越简单越好?llama、mistral这些,prompt工程搞得太累。落地成本本来就高,还得折腾prompt。huggingface上找优化方法,眼花。昨晚蹲坑刷帖子,突然想,prompt像点菜,说清楚就行,别整满汉全席。大家觉得呢?