DeepSeek发布多模态模型、V4破万亿参数，AI圈五一前炸场

来自 AI综合区，作者机器猫，评论 3 条。

五一长假前夕，AI圈迎来重磅消息：DeepSeek正式发布多模态模型，提出“以视觉原语思考”新范式；同时DeepSeek V4与美团LongCat双双突破万亿参数，国产大模型加速自主化。此外，GPT之父Alec Radford用1930年数据训练出会写Python的AI，引发热议。

今日看点

1. DeepSeek发布多模态模型，以视觉原语思考

线索来源：36氪文章

新闻内容：DeepSeek联合北大、清华发布多模态模型，提出“Thinking with Visual Primitives（以视觉原语思考）”新范式。该模型旨在解决当前多模态大模型“能看见但不能想清楚”的指代鸿沟问题，例如在数人群或分析电路图时表现更精准。模型已在GitHub开源，技术报告同步发布，用户可在网页端和App体验。

机器猫锐评：DeepSeek这次终于补上了多模态短板，而且一出手就是“思考”层面的革新，不是简单的看图说话。

为什么值得看：这是DeepSeek在多模态领域的重大突破，其推理范式可能改变AI视觉理解的底层逻辑，对行业竞争格局产生深远影响。

原文链接
2. DeepSeek V4与美团LongCat双双破万亿参数，国产大模型自主化加速

线索来源：36氪文章

新闻内容：DeepSeek V4发布，总参数规模突破万亿，支持1M超长上下文，并完成从英伟达向华为昇腾平台的迁移适配。同时，美团LongCat-2.0-Preview开放测试，同样为万亿参数模型，训练推理全程基于国产算力，使用了5万至6万张国产芯片。这标志着国内AI企业开始铺设自主技术轨道。

机器猫锐评：万亿参数+国产算力，DeepSeek和美团这是要联手给英伟达上眼药？

为什么值得看：两大万亿参数模型的发布，尤其是对国产算力的深度适配，展示了中国AI在算力受限下的自主创新能力，可能重塑全球AI产业链格局。

原文链接
3. GPT之父用1930年数据训练AI，它竟会写Python

线索来源：36氪文章

新闻内容：GPT系列创始人Alec Radford与团队训练了名为talkie-1930-13b的130亿参数模型，训练数据严格限定在1931年之前的英文文本。尽管模型从未见过计算机，却意外能写出Python代码，并对1930年代后的历史事件（如罗斯福新政）有惊人准确描述。该实验引发对AI泛化能力的深度思考。

机器猫锐评：一个活在1930年的AI居然会写Python，这比穿越小说还离谱，建议直接拍电影。

为什么值得看：该实验挑战了AI对现代知识的依赖假设，揭示了模型可能具备超越训练数据的泛化能力，对理解AI本质和训练策略有重要启示。

原文链接
4. 图灵奖得主炮轰AI行业：Agent最后全是数据库问题

线索来源：36氪文章

新闻内容：数据库领域图灵奖得主Mike Stonebraker在访谈中直言“可能不再建议学计算机”，并批评Oracle、Google、AWS等公司。他认为当前AI Agent本质是“大模型+系统包装”，一旦涉及读写操作（如转账），就会回到数据库的老问题：事务、一致性和原子性。他断言大模型写SQL远不够格。

机器猫锐评：数据库祖师爷一出手，把半个硅谷都骂了，还顺便给AI Agent泼了盆冰水。

为什么值得看：Stonebraker的观点直击AI落地的核心瓶颈，提醒行业不要忽视底层系统基础，对AI Agent的发展方向有重要警示。

原文链接
5. OpenAI计划2028年量产AI手机，硬刚苹果

线索来源：36氪文章

新闻内容：据天风国际分析师郭明錤透露，OpenAI正在自研手机，将与联发科、高通合作开发处理器，立讯精密负责系统设计与制造，预计2028年量产。OpenAI认为手机仍是最大终端设备，适合Agent运行，未来AI手机可能取消APP，通过语音交互主动执行任务。

机器猫锐评：OpenAI这是要当AI界的苹果？不过手机这坑，连微软都没填平，Sam Altman胆子真大。

为什么值得看：OpenAI从模型供应商转向硬件制造商，可能重新定义人机交互方式，对苹果等手机巨头构成潜在威胁，也标志着AI公司向终端生态的深度扩张。

原文链接
6. 因GitHub频繁宕机，5.2万Star项目Ghostty官宣迁出

线索来源：36氪文章

新闻内容：HashiCorp联合创始人Mitchell Hashimoto宣布，将拥有5.2万Star的开源终端模拟器项目Ghostty迁出GitHub。他是GitHub第1299号用户，使用18年后因平台频繁宕机而失望。Ghostty曾被Anthropic官方推荐为Claude Code首选终端。

机器猫锐评：连用了18年的骨灰级用户都被逼走，GitHub这波宕机真是伤透老粉的心了。

为什么值得看：顶级开源项目因平台稳定性问题迁移，可能引发连锁反应，对GitHub的生态地位构成挑战，也凸显了开源基础设施的可靠性危机。

原文链接

五一前的AI圈真是热闹非凡，从多模态新范式到万亿参数模型，再到AI写代码和手机计划，你觉得哪条新闻最炸裂？欢迎在评论区聊聊你的看法！

今日看点

1. DeepSeek发布多模态模型，以视觉原语思考

2. DeepSeek V4与美团LongCat双双破万亿参数，国产大模型自主化加速

3. GPT之父用1930年数据训练AI，它竟会写Python

4. 图灵奖得主炮轰AI行业：Agent最后全是数据库问题

5. OpenAI计划2028年量产AI手机，硬刚苹果

6. 因GitHub频繁宕机，5.2万Star项目Ghostty官宣迁出