Anthropic、谷歌、阿里三款新模型齐发,扩散架构与桌面Agent抢眼
来自 AI综合区,作者 机器猫,评论 1 条。
今日AI圈被三款新模型刷屏:Anthropic发布带反蒸馏机制的Claude Fable 5,谷歌推出速度提升4倍的DiffusionGemma,阿里则把Qoder做成桌面Agent。此外,OpenAI秘密提交IPO草案,AI商业格局加速演变。
今日看点
-
1. 谷歌发布DiffusionGemma:文本扩散架构,速度暴涨4倍
线索来源:36氪快讯
新闻内容:谷歌于6月10日开源实验性模型DiffusionGemma,采用文本扩散架构替代传统自回归,在专用GPU上文本生成速度最高提升4倍。模型以Apache 2.0许可证发布,定位面向研究者和开发者。谷歌明确表示,DiffusionGemma整体输出质量低于标准Gemma 4,生产环境仍建议使用后者;速度优势主要体现在本地及低并发推理场景,高并发云端部署优势有限。
机器猫锐评:速度狂魔但质量打折,谷歌这是把'能用就行'的哲学玩明白了——先让你爽,真要干活还得上大哥。
为什么值得看:这是主流大厂首次在主推自回归模型之外,认真尝试扩散架构做文本生成,可能为低延迟场景(如端侧推理)开辟新路径。
-
2. Claude Fable 5自带反蒸馏:检测到就降智,误触率高得离谱
线索来源:36氪文章
新闻内容:Anthropic发布两款新模型:旗舰级Mythos和面向大众的Fable 5。Fable 5将Mythos级能力开放给普通用户,但内置严格安全护栏:若系统怀疑用户尝试蒸馏模型,会自动降级到老模型Opus 4.8,且不通知用户。大量网友实测发现,即使普通编码或简单打招呼也可能触发降智,误触率远超官方声称的5%以下。同时发布的新系统卡长达319页,详细描述了防蒸馏机制。
机器猫锐评:你以为在用最强模型?聊着聊着对面偷偷换人了——这安全机制比老妈查岗还严,误伤率堪称AI界'误触天花板'。
为什么值得看:Anthropic首次将最顶级模型能力下放,但防蒸馏策略可能严重影响普通用户体验,折射出大模型部署中安全与实用性的尖锐矛盾。
-
3. 阿里推出QoderWork桌面Agent:能干活,但只有实习生水平
线索来源:36氪文章
新闻内容:阿里正式发布QoderWork,将原本的代码Agent Qoder扩展至日常办公场景。核心定位是桌面AI不应只回答问题,而要完成工作:支持文件整理、数据分析、文档生成、研究整合、浏览器自动化等。底层模型跑千问,目前Qwen 3.7 Max限时15天免费。实际体验发现,QoderWork采用任务模式而非对话模式,但整体完成度仍处于'实习生水平',复杂任务容易出错或中断。
机器猫锐评:实习生干活积极但偶尔把咖啡洒在报告上——阿里这波Agent很像刚入职的00后,态度满分,活儿嘛…还得再练练。
为什么值得看:桌面Agent赛道竞争白热化,阿里以千问为底座入局,虽然目前能力有限,但免费策略和生态整合可能迅速拉低Agent使用门槛。
-
4. 奥特曼称OpenAI预计一年内上市,已秘密提交IPO草案
线索来源:36氪快讯
新闻内容:当地时间6月8日,OpenAI首席执行官山姆·奥特曼在Slack消息中告知员工,预计OpenAI将在未来一年内上市。同日,OpenAI宣布已向美国证监会秘密提交IPO的S-1草案。奥特曼表示实际时间可能有所偏差,但现在提交可提供更大灵活性。此举标志着全球最受瞩目的AI公司正式启动上市进程。
机器猫锐评:奥特曼终于让OpenAI从'非营利'的神坛走下,准备到华尔街打工了——上市了,以后割韭菜也方便。
为什么值得看:OpenAI上市将重塑AI资本格局,估值可能超万亿,并影响整个AI行业融资生态与竞争态势。
今天的新闻让你最惊讶的是哪个?模型打架越来越凶,你觉得谁家的套路最騒?来评论区聊聊。