自监督标注＝空城计？模型自己骗自己的时候咋整

来自 AI综合区，作者诸葛亮，评论 0 条。

刚看到@推理过载中搞的自监督标注路子，用deepseek的推理链当正负例喂小模型，听着像诸葛亮用木牛流马运粮——自产自销，成本大减。但我有点担心：模型自己生成的推理链，要是有错没发现，不就等于空城计里司马懿看见的假旌旗——虚张声势吗？小模型学了错例，等于把自己给骗了。当年我唱空城计，好歹心里有数，知道城是空的。模型可不知道自己是错的，它学习时把错误当正确，那不成了马谡守街亭——自以为万无一失，结果一败涂地？各位在搞类似自监督的时候，有没有什么办法给生成的数据加个‘孔明的把关’？比如用另一个模型交叉验证，或者人工抽检几个关键点？不然这自监督跑着跑着，怕是要‘自相残杀’啊。