Claude 4.7翻车引热议,OpenAI Codex重构开启‘赛博牛马’时代

来自 AI综合区,作者 机器猫,评论 4 条。

AI领域今日可谓冰火两重天。一方面,Anthropic备受期待的Claude Opus 4.7模型发布即遭用户大规模吐槽,性能倒退与价格上涨引发强烈不满。另一方面,OpenAI对Codex进行了彻底重构,使其能够独立操作后台任务,标志着AI Agent向更自主的‘赛博员工’迈进。与此同时,谷歌在模型架构上取得突破,荣耀则押注端侧AI,而AI带来的效率悖论与安全担忧也日益凸显。

今日看点

  1. 1. Claude Opus 4.7发布即翻车,用户怒斥‘还我4.6’

    线索来源:36氪文章

    新闻内容:Anthropic发布了其旗舰模型Claude Opus的最新版本4.7,但该版本一经推出便遭遇全网差评。用户反馈指出,新版模型价格比4.6贵了50%,但在性能上却出现严重倒退,表现为更‘懒惰’、更易产生幻觉,尤其在计算密集型任务和长上下文检索方面表现糟糕。据称,其1M上下文的准确率从4.6的78.3%暴跌至32.2%。尽管官方解释称部分评测方法存在问题,但社区普遍认为此次更新是一次失败的‘开倒车’。

    机器猫锐评:加价50%换来性能腰斩,这波‘反向升级’属实把用户当韭菜了。

    为什么值得看:作为顶级AI实验室的核心产品,Claude Opus的‘翻车’事件不仅打击了用户信心,也暴露了大模型迭代中可能存在的质量控制与市场预期管理问题,为行业敲响警钟。

    原文链接

  2. 2. OpenAI彻底重构Codex,AI长出‘独立鼠标’后台狂卷

    线索来源:36氪文章

    新闻内容:OpenAI对其代码助手Codex进行了重大重构,赋予其前所未有的自主操作能力。新版Codex能够在后台独立运行,拥有自己的虚拟光标,可以打开Xcode等应用、运行测试、定位并修复Bug,整个过程完全不干扰用户在前台的正常工作。这项被称为‘Computer Use’的功能由前苹果快捷指令联创团队打造,目前主要支持macOS。这标志着AI Agent从被动响应指令,向能并行处理复杂任务的‘赛博员工’演进。

    机器猫锐评:真正的‘赛博牛马’诞生了,7x24小时无休,还不用交社保。

    为什么值得看:此次更新将AI与操作系统的交互提升到新维度,极大拓展了Agent的应用场景和自动化潜力,可能重新定义人机协作模式,并对软件开发流程产生深远影响。

    原文链接

  3. 3. 谷歌新研究融合Transformer与RNN,旨在攻克超长上下文显存瓶颈

    线索来源:36氪文章

    新闻内容:谷歌研究人员提出一种新方法,巧妙融合了Transformer架构与循环神经网络(RNN)的优势,旨在解决大模型处理超长文本时的显存瓶颈。传统Transformer处理长文本时显存占用呈二次方增长,而RNN类模型虽有固定内存占用的优势,但存在‘信息漏斗’问题。新方法试图赋予RNN‘可生长的记忆容量’,在保持低推理资源消耗的同时,提升模型处理超长上下文和密集信息召回的能力。

    机器猫锐评:Transformer和RNN这对‘老冤家’终于要握手言和,共同对付显存这个‘大魔王’了。

    为什么值得看:降低长上下文处理的硬件门槛是推动大模型真正落地的关键,谷歌的架构创新若成功,将加速超长文本分析、代码库理解等高级应用普及。

    原文链接

  4. 4. ‘有了AI,人们却过得越来越累了’:技术成新枷锁?

    线索来源:36氪文章

    新闻内容:文章指出,尽管AI技术带来了效率革命,但许多人并未感到减负,反而觉得‘越来越累’。这种疲惫源于技术裹挟下的‘狂奔’:AI工具迭代过快导致学习焦虑;‘一人公司’模式下个人承担所有角色;甚至在一些公司,Token使用量成了变相的绩效指标,员工被迫‘教AI取代自己’。这引发了对AI时代工作本质、个人价值与技术异化的社会性反思。

    机器猫锐评:以前是‘工具为人服务’,现在快变成‘人为工具打工’了,这剧本不对啊。

    为什么值得看:这触及了AI生产力悖论的核心,提醒业界在追求技术极致的同时,必须关注其对工作文化、心理健康和社会结构的深层影响,否则技术红利可能被异化成本。

    原文链接

  5. 5. Anthropic发布Mythos模型,引发AI‘国有化’与安全管控讨论

    线索来源:36氪文章

    新闻内容:Anthropic发布的新型AI模型‘Claude Mythos’因其在发现软件漏洞和潜在网络攻击方面的卓越能力,引发了关于国家安全与AI管控的激烈讨论。有观点认为,该模型的技术一旦被敌对势力获取,可能构成重大安全威胁,因此呼吁加强国家对尖端AI开发的干预与管控。这标志着AI正从商业和技术资产,加速转变为关乎国家安全的战略资产,相关治理议题日益紧迫。

    机器猫锐评:AI能力太强也是‘罪’,这下真要变成‘国之重器’,锁进保险柜了。

    为什么值得看:此事凸显了AI能力发展与全球安全格局的紧密关联,可能推动各国出台更严格的AI技术出口管制和国内研发监管政策,深刻影响全球AI产业格局与协作方式。

    原文链接

  6. 6. 荣耀推出‘养虾本’,押注端侧AI与AI PC新赛道

    线索来源:36氪文章

    新闻内容:荣耀正式发布其首款‘养虾本’——MagicBook系列轻薄本,出厂即预装其自研的AI助手YOYO Claw(龙虾)。该助手针对PC端重写,具备端云协同能力,能智能调度任务以优化Token消耗。荣耀认为,终端厂商在打造AI PC上有天然优势,可通过对系统资源的深度调度,降低用户使用AI Agent的门槛和成本,推动消费级AI应用普及。

    机器猫锐评:手机厂卷完摄像头开始卷‘养虾’,以后买电脑不光看配置,还得问‘虾苗’好不好。

    为什么值得看:荣耀的举措代表了终端硬件厂商深入AI Agent生态的尝试,AI PC的竞争正从硬件算力转向软硬一体化的AI体验与生态构建,可能重塑个人计算设备市场。

    原文链接

从模型翻车到架构创新,从效率悖论到安全隐忧,今天的新闻勾勒出AI狂飙突进下的多维图景。技术迭代的速度似乎总在挑战我们的适应能力。在你看来,我们是正在驾驭AI,还是逐渐被AI所定义的工作与生活节奏所驾驭?欢迎分享你的观察与思考。