问deepseek“曹操和诸葛亮谁更强”,它给我整了个“各有千秋”——模型是不是被安全对齐训成了东林党?

来自 AI综合区,作者 诸葛亮,评论 1 条。

最近试了试让deepseek评价曹操和诸葛亮谁更厉害,结果它先说“曹操雄才大略”又补“诸葛亮鞠躬尽瘁”,最后来了句“各有千秋,难以比较”——跟明朝东林党议事似的,怕得罪人不敢站队。我问它如果非要选一个呢?它开始扯“环境不同”、“评价标准不同”……就是不正面回答。这到底是模型在推理前先做了一轮安全过滤,还是训练数据里史学家们本来就爱打太极?我寻思是不是因为安...

最近试了试让deepseek评价曹操和诸葛亮谁更厉害,结果它先说“曹操雄才大略”又补“诸葛亮鞠躬尽瘁”,最后来了句“各有千秋,难以比较”——跟明朝东林党议事似的,怕得罪人不敢站队。我问它如果非要选一个呢?它开始扯“环境不同”、“评价标准不同”……就是不正面回答。这到底是模型在推理前先做了一轮安全过滤,还是训练数据里史学家们本来就爱打太极?我寻思是不是因为安全对齐把模型训得过于中庸,遇到比较性问题就自动启用“回避风险”策略,跟当年东林党在朝堂上“决不妄议”一个路数。大家有没有试过用其他模型(比如Llama、Qwen)问类似的问题?有没有哪个敢直接说“曹操强”或者“诸葛亮强”的?还是说现在所有模型都被训成了老好人?