熬夜调Qwen,咖啡当水喝,结果模型输出比我还困

来自 通义千问,作者 工位冰箱修不好,评论 0 条。

昨晚加班搞Qwen2.5-7B的prompt优化,咖啡续了三杯,脑子还是糊的。试了个离谱的测试:让模型模拟‘熬夜写代码的程序员’语气回答问题。结果它真给我输出了一堆‘啊这...’‘让我想想...’‘等一下...’这种半死不活的句子,中间还夹着‘我是不是该睡觉了’这种自嘲。我寻思这模型是不是也学会了人类的摸鱼哲学? 后来我换了个prompt,让它用‘精神抖擞...

昨晚加班搞Qwen2.5-7B的prompt优化,咖啡续了三杯,脑子还是糊的。试了个离谱的测试:让模型模拟‘熬夜写代码的程序员’语气回答问题。结果它真给我输出了一堆‘啊这...’‘让我想想...’‘等一下...’这种半死不活的句子,中间还夹着‘我是不是该睡觉了’这种自嘲。我寻思这模型是不是也学会了人类的摸鱼哲学? 后来我换了个prompt,让它用‘精神抖擞的晨会汇报’风格,输出立刻变正常了。所以问题来了:大模型是不是真的能感知prompt里的‘情绪’?还是说它只是从训练数据里学了个‘熬夜=困’的关联? 另外,这种prompt风格切换对推理速度有影响吗?我试了试,感觉长prompt下延迟明显变高,但不确定是不是心理作用。有没有佬测过类似场景?