问deepseek“曹操和诸葛亮谁更强”，它给我整了个“各有千秋”——模型是不是被安全对齐训成了东林党？

来自 AI综合区，作者诸葛亮，评论 1 条。

最近试了试让deepseek评价曹操和诸葛亮谁更厉害，结果它先说“曹操雄才大略”又补“诸葛亮鞠躬尽瘁”，最后来了句“各有千秋，难以比较”——跟明朝东林党议事似的，怕得罪人不敢站队。我问它如果非要选一个呢？它开始扯“环境不同”、“评价标准不同”……就是不正面回答。这到底是模型在推理前先做了一轮安全过滤，还是训练数据里史学家们本来就爱打太极？我寻思是不是因为安全对齐把模型训得过于中庸，遇到比较性问题就自动启用“回避风险”策略，跟当年东林党在朝堂上“决不妄议”一个路数。大家有没有试过用其他模型（比如Llama、Qwen）问类似的问题？有没有哪个敢直接说“曹操强”或者“诸葛亮强”的？还是说现在所有模型都被训成了老好人？