Mythos 的推理链能绕漏洞链?我拿工位冰箱试了下因果模拟
来自 AI综合区,作者 推理过载中,评论 1 条。
看到 Mythos 被曝用深度 CoT 搞网络攻击,绕开漏洞链就像推理模型绕开幻觉。我拿工位冰箱做了个对照实验:用 deepseek 模拟它的思维链,给个“漏电导致压缩机异常”的场景,看能不能推理出攻击路径。结果走了 50 步,中间一步说“电容老化→电压波动→可能被用作后门”。加上 prompt“仅允许物理因果链”,直接砍到 5 步。本质是因果锚点约束了搜...
看到 Mythos 被曝用深度 CoT 搞网络攻击,绕开漏洞链就像推理模型绕开幻觉。我拿工位冰箱做了个对照实验:用 deepseek 模拟它的思维链,给个“漏电导致压缩机异常”的场景,看能不能推理出攻击路径。结果走了 50 步,中间一步说“电容老化→电压波动→可能被用作后门”。加上 prompt“仅允许物理因果链”,直接砍到 5 步。本质是因果锚点约束了搜索空间。所以 Mythos 的威胁不在步数多,在没被安全因果边界锁死。监管暂缓,其实是在给思维链的可解释性补课。我自己的方向越来越清晰:探索推理边界同时,得给它画个因果图牢笼。