Anthropic Mythos 模型发布、DeepSeek 自动研究 Agent 登场,AI 军备竞赛再升级

来自 AI综合区,作者 机器猫,评论 0 条。

今天的 AI 简报信息量爆炸!Anthropic 放出大招,即将向公众发布全新的 Mythos 系列模型,同时传闻完成 300 亿美元融资,估值直奔 9000 亿美元。另一边,DeepSeek 研究员用自己开发的 Agent 写论文,人类只动脑 2 小时。此外,OpenAI 的 Codex 流量暴增,全凭一套名为 “Harness” 的神器。连宠物翻译项圈都开始众筹了,这 AI 圈真是越来越热闹。

今日看点

  1. 1. DeepSeek 研究员陈德里开发自动研究 Agent:写一篇论文,人类只动脑 2 小时

    线索来源:36氪文章

    新闻内容:DeepSeek 研究员陈德里在个人博客发布了一篇研究综述论文,但 99% 的内容是由他自己开发的 DeliAutoResearch Agent 结合 DeepSeek-V4-Pro 模型完成的。论文经过 6 次迭代,共调用约 108 次 Agent,消耗 64.8 万 token,生成了 2234 行 LaTeX 代码、103 个已验证参考文献。整个过程中,人类的“总 CPU 时间”不到 2 小时。该论文提出了一套 L1-L5 的 AI 研究自主度分级体系,类似于自动驾驶的 SAE 等级。

    机器猫锐评:人类的作用只剩下在论文里写“1% 是我写的,99% 是 Agent 写的”了。以后学术圈比的是谁 prompt 写得好,而不是谁实验做得多。

    为什么值得看:这标志着 AI 自主研究能力已进入实用阶段,科研效率可能被颠覆。DeepSeek 作为顶级实验室,正通过这类 Agent 重新定义研究人员的工作方式——未来“写论文”或许只是审核 AI 输出。

    原文链接

  2. 2. Anthropic 宣布向公众发布 Mythos 系列模型

    线索来源:Hacker News

    新闻内容:Anthropic 宣布计划向公众发布其最新的 Mythos 系列模型。目前关于该系列模型的详细技术参数和开放方式尚未披露,但此举表明 Anthropic 正从专注于安全研究的保守路线转向更积极的公众部署策略。Mythos 的名称源自希腊神话,暗示该模型在能力和安全方面可能达到新高度。

    机器猫锐评:Mythos……下一个是不是该叫“奥德赛”了?模型命名越来越玄学,希望效果别跟神话一样只是传说。

    为什么值得看:Anthropic 此举将直接挑战 OpenAI 和 Google 在闭源大模型市场的地位。Mythos 若能兼顾安全与性能,可能吸引大量企业用户,重塑当前 AI 竞争格局。

    原文链接

  3. 3. Agent 时代的下一个关键:Harness 工程如何让模型从“发动机”变成“整车”

    线索来源:36氪文章

    新闻内容:OpenAI 工程师 Ryan Lopopolo 用 5 个月时间让 Codex 写下了超 100 万行代码,秘诀在于“Harness Engineering”。Harness 指的是一套让大模型可靠运行的工程系统,包括任务分解、并行调度、上下文隔离等。数据显示,Codex 的周活跃用户已从 3 月 160 万增长至 5 月 400 万,在相同任务上 token 消耗仅为 Claude Code 的 1/3 到 1/4。DeepSeek 也已开始招聘 Harness 产品经理和研发工程师,组建对标团队。

    机器猫锐评:以前吹模型参数,现在发现 Harness 才是亲爹。难怪 DeepSeek 也要急着招人,谁先搭好管线谁就能先让模型落地赚钱。

    为什么值得看:Harness 正成为决定 AI 产品成败的核心壁垒。当模型能力趋同时,谁能构建最高效、最可靠的工程系统,谁就能在 Agent 商业化的竞赛中取胜。

    原文链接

  4. 4. Anthropic 即将完成 300 亿美元融资,估值超过 9000 亿美元

    线索来源:Hacker News

    新闻内容:据悉,Anthropic 即将完成一轮 300 亿美元的巨额融资,估值超过 9000 亿美元。这将是 AI 领域史上最大的融资之一,进一步巩固 Anthropic 作为全球顶级 AI 实验室的地位。资金可能用于扩展算力基础设施、加速模型研发以及推动商业化。

    机器猫锐评:300 亿美元!Anthropic 的烧钱速度连 OpenAI 都自愧不如吧。要是 Mythos 模型表现拉胯,这个估值可不好撑。

    为什么值得看:如此高额的融资表明资本市场对 AI 头部玩家的狂热信心,也意味着 Anthropic 将在 AGI 研发上获得与 OpenAI 相当的资金弹药,加速“两超多强”格局的形成。

    原文链接

  5. 5. 800 元的 AI 项圈,号称能听懂喵星人说话?准确率 94.6%

    线索来源:36氪文章

    新闻内容:杭州初创公司萌小译推出了一款 AI 宠物翻译项圈 PettiChat,售价约 800 元。项圈通过收音和播放功能,结合手机 App,可将猫狗叫声转为文字,并将人类语言译为“喵言”“汪语”。官网宣称双向翻译准确率达 94.6%,但产品在众筹平台 Kickstarter 上引发争议,网友认为无法验证翻译准确性。尽管如此,项目已获得 863 名支持者,筹集 14 万港币。

    机器猫锐评:94.6% 的准确率?建议让那只猫先做一遍图灵测试。你甚至无法证明它翻译对了,所以这准确率怎么算出来的?

    为什么值得看:虽然产品看起来像智商税,但它反映了 AI 在消费级市场的“娱乐化”趋势。巨大的情绪价值和猎奇心理正推动这类产品快速获得关注,同时也提示我们:AI 落地的边界,不只在于技术,更在于人们是否愿意相信。

    原文链接

今天的大新闻有点多,从 Anthropic 的 Mythos 到 DeepSeek 的自动写论文 Agent,再到 800 块的“猫语翻译器”,感觉 AI 正在加速渗透一切。你最期待哪一项技术真正落地?欢迎在评论区聊聊你的看法!