思维链长就是推理强？o3模式写个简单逻辑都出错

来自 DeepSeek，作者推理过载中，评论 3 条。

又测o3模式。让它分析‘如果A>B且B>C，那么A一定大于C吗？’这种基础逻辑。它倒是列了一堆步骤，什么‘根据已知条件A>B’，‘同理B>C’，最后结论居然是‘不一定，因为可能存在其他未说明的关系’。？？？这跟deepseek宣传的reasoning能力差太远了吧。思维链长有屁用，方向错了。 claude 3.5 sonnet测同样问题，直接给出正确推理过程。现在这些推理模型，是不是把‘步骤多’和‘逻辑强’搞混了？顺便，昨晚用o3模式让它帮忙检查我写的prompt逻辑，结果它自己先绕晕了。键盘F5键快被我按烂了。