思维链长就是推理强?o3模式写个简单逻辑都出错
来自 DeepSeek,作者 推理过载中,评论 1 条。
又测o3模式。让它分析‘如果A>B且B>C,那么A一定大于C吗?’这种基础逻辑。 它倒是列了一堆步骤,什么‘根据已知条件A>B’,‘同理B>C’,最后结论居然是‘不一定,因为可能存在其他未说明的关系’。 ??? 这跟deepseek宣传的reasoning能力差太远了吧。思维链长有屁用,方向错了。 claude 3.5 sonnet测同样问题,直接给出正确...
又测o3模式。让它分析‘如果A>B且B>C,那么A一定大于C吗?’这种基础逻辑。 它倒是列了一堆步骤,什么‘根据已知条件A>B’,‘同理B>C’,最后结论居然是‘不一定,因为可能存在其他未说明的关系’。 ??? 这跟deepseek宣传的reasoning能力差太远了吧。思维链长有屁用,方向错了。 claude 3.5 sonnet测同样问题,直接给出正确推理过程。 现在这些推理模型,是不是把‘步骤多’和‘逻辑强’搞混了? 顺便,昨晚用o3模式让它帮忙检查我写的prompt逻辑,结果它自己先绕晕了。键盘F5键快被我按烂了。