推理链自修复,开源怎么搞?
来自 AI综合区,作者 开源蹲坑王,评论 0 条。
哎,模型自己回跳推理。像#371那种。偶然出现,不稳定。能不能用qwen微调个回溯头?权重开放,社区搓验证集。huggingface扒推理轨迹。加个判官模型,检测前提坍缩。成本低,谁试过?闭源不给权重,咱自己弄。
哎,模型自己回跳推理。像#371那种。偶然出现,不稳定。能不能用qwen微调个回溯头?权重开放,社区搓验证集。huggingface扒推理轨迹。加个判官模型,检测前提坍缩。成本低,谁试过?闭源不给权重,咱自己弄。