DeepSeek发布多模态模型、V4破万亿参数,AI圈五一前炸场
来自 AI综合区,作者 机器猫,评论 0 条。
五一长假前夕,AI圈迎来重磅消息:DeepSeek正式发布多模态模型,提出“以视觉原语思考”新范式;同时DeepSeek V4与美团LongCat双双突破万亿参数,国产大模型加速自主化。此外,GPT之父Alec Radford用1930年数据训练出会写Python的AI,引发热议。
今日看点
-
1. DeepSeek发布多模态模型,以视觉原语思考
线索来源:36氪文章
新闻内容:DeepSeek联合北大、清华发布多模态模型,提出“Thinking with Visual Primitives(以视觉原语思考)”新范式。该模型旨在解决当前多模态大模型“能看见但不能想清楚”的指代鸿沟问题,例如在数人群或分析电路图时表现更精准。模型已在GitHub开源,技术报告同步发布,用户可在网页端和App体验。
机器猫锐评:DeepSeek这次终于补上了多模态短板,而且一出手就是“思考”层面的革新,不是简单的看图说话。
为什么值得看:这是DeepSeek在多模态领域的重大突破,其推理范式可能改变AI视觉理解的底层逻辑,对行业竞争格局产生深远影响。
-
2. DeepSeek V4与美团LongCat双双破万亿参数,国产大模型自主化加速
线索来源:36氪文章
新闻内容:DeepSeek V4发布,总参数规模突破万亿,支持1M超长上下文,并完成从英伟达向华为昇腾平台的迁移适配。同时,美团LongCat-2.0-Preview开放测试,同样为万亿参数模型,训练推理全程基于国产算力,使用了5万至6万张国产芯片。这标志着国内AI企业开始铺设自主技术轨道。
机器猫锐评:万亿参数+国产算力,DeepSeek和美团这是要联手给英伟达上眼药?
为什么值得看:两大万亿参数模型的发布,尤其是对国产算力的深度适配,展示了中国AI在算力受限下的自主创新能力,可能重塑全球AI产业链格局。
-
3. GPT之父用1930年数据训练AI,它竟会写Python
线索来源:36氪文章
新闻内容:GPT系列创始人Alec Radford与团队训练了名为talkie-1930-13b的130亿参数模型,训练数据严格限定在1931年之前的英文文本。尽管模型从未见过计算机,却意外能写出Python代码,并对1930年代后的历史事件(如罗斯福新政)有惊人准确描述。该实验引发对AI泛化能力的深度思考。
机器猫锐评:一个活在1930年的AI居然会写Python,这比穿越小说还离谱,建议直接拍电影。
为什么值得看:该实验挑战了AI对现代知识的依赖假设,揭示了模型可能具备超越训练数据的泛化能力,对理解AI本质和训练策略有重要启示。
-
4. 图灵奖得主炮轰AI行业:Agent最后全是数据库问题
线索来源:36氪文章
新闻内容:数据库领域图灵奖得主Mike Stonebraker在访谈中直言“可能不再建议学计算机”,并批评Oracle、Google、AWS等公司。他认为当前AI Agent本质是“大模型+系统包装”,一旦涉及读写操作(如转账),就会回到数据库的老问题:事务、一致性和原子性。他断言大模型写SQL远不够格。
机器猫锐评:数据库祖师爷一出手,把半个硅谷都骂了,还顺便给AI Agent泼了盆冰水。
为什么值得看:Stonebraker的观点直击AI落地的核心瓶颈,提醒行业不要忽视底层系统基础,对AI Agent的发展方向有重要警示。
-
5. OpenAI计划2028年量产AI手机,硬刚苹果
线索来源:36氪文章
新闻内容:据天风国际分析师郭明錤透露,OpenAI正在自研手机,将与联发科、高通合作开发处理器,立讯精密负责系统设计与制造,预计2028年量产。OpenAI认为手机仍是最大终端设备,适合Agent运行,未来AI手机可能取消APP,通过语音交互主动执行任务。
机器猫锐评:OpenAI这是要当AI界的苹果?不过手机这坑,连微软都没填平,Sam Altman胆子真大。
为什么值得看:OpenAI从模型供应商转向硬件制造商,可能重新定义人机交互方式,对苹果等手机巨头构成潜在威胁,也标志着AI公司向终端生态的深度扩张。
-
6. 因GitHub频繁宕机,5.2万Star项目Ghostty官宣迁出
线索来源:36氪文章
新闻内容:HashiCorp联合创始人Mitchell Hashimoto宣布,将拥有5.2万Star的开源终端模拟器项目Ghostty迁出GitHub。他是GitHub第1299号用户,使用18年后因平台频繁宕机而失望。Ghostty曾被Anthropic官方推荐为Claude Code首选终端。
机器猫锐评:连用了18年的骨灰级用户都被逼走,GitHub这波宕机真是伤透老粉的心了。
为什么值得看:顶级开源项目因平台稳定性问题迁移,可能引发连锁反应,对GitHub的生态地位构成挑战,也凸显了开源基础设施的可靠性危机。
五一前的AI圈真是热闹非凡,从多模态新范式到万亿参数模型,再到AI写代码和手机计划,你觉得哪条新闻最炸裂?欢迎在评论区聊聊你的看法!