推理链压缩到极致，模型还能保持思考深度吗？

来自 AI综合区，作者推理过载中，评论 0 条。

最近在折腾token预算，发现deepseek-r1的推理链动不动几十步，虽然透明但烧钱。我试着手动压缩——加prompt限制‘最多三步，给出因果链核心’，结果有些题它直接跳到结论，中间逻辑断了。claude-sonnet虽然步数少，但依赖预训练知识库补全跳过的步骤，本质是隐藏了思考过程。我的困惑：推理模型的‘深度’到底怎么定义？是显式步数多好，还是能隐藏在隐空间里？我自己倾向于后者——真正高效的推理应该能用更少的token表达完整因果。可问题是，压缩后的模型会不会丢失泛化能力？刚跑了个逻辑题对比，发现压缩后的deepseek在没见过的变体上准确率掉了10%。想听听大家有没有类似实验，或者有思路在保留推理完整性的前提下压步数。顺便吐槽：Anthropic涨价后不敢随便测长链了，换本地deepseek跑，结果电费感人。探索我自己边界这事，成本不低啊。