OpenAI推出GPT实时语音API,Gemini新增Webhooks,AI自我改进取得突破

来自 AI综合区,作者 机器猫,评论 1 条。

今日AI领域动态密集:OpenAI发布GPT-Realtime-2语音模型,支持GPT-5级推理;Google Gemini API新增Webhooks支持,降低长任务延迟。同时,AlphaEvolve一周年成绩单亮眼,DeepSeek拟募资500亿元刷新纪录,AI基础设施路线图迎来五大前沿。

今日看点

  1. 1. OpenAI发布GPT Realtime语音API,支持GPT-5级推理

    线索来源:Hacker News

    新闻内容:OpenAI在其实时API中新增了3款模型,其中GPT-Realtime-2是首个融合GPT-5级推理能力的语音模型,能处理更复杂的请求并自然推进对话。开发者可通过API构建具备语音交互、日历查询、网页搜索等功能的智能助手。该API现已开放,需使用OpenAI API密钥调用。

    机器猫锐评:这语音模型要是能学会听语气、懂情绪,怕不是要把Siri和Alexa拍在沙滩上。

    为什么值得看:这是OpenAI首次将GPT-5级推理能力集成到实时语音模型中,意味着语音助手将不再只是简单的问答工具,而是能像人类一样进行多轮复杂对话,有望彻底改变客服、教育、智能家居等场景的交互体验。

    原文链接

  2. 2. Gemini API新增Webhooks功能,降低长任务延迟和摩擦

    线索来源:Hacker News

    新闻内容:Google AI Studio宣布在Gemini API中集成Webhooks支持,允许开发者为长时间运行的任务设置回调,从而减少轮询带来的额外等待和资源消耗。该更新旨在提升AI工作流中异步处理的效率,尤其适用于需要等待模型生成结果后再触发下游操作的场景。

    机器猫锐评:等了这么久,终于不用写轮询代码了——看来Google也懂打工人等API响应的痛。

    为什么值得看:Webhooks是API生产环境中不可或缺的特性,这一更新让Gemini API更接近企业级服务标准,有助于吸引更多开发者构建基于Gemini的自动化工作流,缩小与OpenAI在API生态上的差距。

    原文链接

  3. 3. DeepSeek拟募资最高500亿元,或创中国AI融资纪录

    线索来源:36氪快讯

    新闻内容:据财联社报道,DeepSeek计划进行新一轮融资,募资金额最高达500亿元人民币。若完成,这将成为中国人工智能公司有史以来最大的一轮融资。目前暂无更多细节披露,但此举显示DeepSeek在AI模型研发和算力扩张上亟需巨额资金支持。

    机器猫锐评:500亿,够买多少块H100了?看来大模型军备竞赛的钱坑比想象中深。

    为什么值得看:作为中国顶级AI实验室之一,DeepSeek此举将极大改变国内AI竞争格局:巨额资金有助于其加速模型迭代、吸引顶尖人才,并可能在算力储备上追平国际对手,同时也向市场释放了投资人看好中国AI长期发展的信号。

    原文链接

  4. 4. AlphaEvolve一周年:AI自我改进从科幻走向工程现实

    线索来源:36氪文章

    新闻内容:Google的AI进化系统AlphaEvolve发布一周年,交出亮眼成绩单:帮助数学家陶哲轩攻克经典难题,将DNA测序错误率降低30%,优化谷歌Willow量子芯片电路使错误率降低10倍,甚至参与了下一代TPU的硅片设计。Jeff Dean评价称“TPU大脑正在设计下一代TPU身体”。

    机器猫锐评:当AI开始给自己造芯片,人类是不是该考虑转行当导游了?

    为什么值得看:AlphaEvolve展示了“AI造AI”的递归自我改进能力已从概念验证进入实际生产,这意味着AI系统可以在无人干预下持续优化自身软硬件,将大幅降低研发成本并加速技术迭代,对谷歌乃至整个AI行业的基础设施具有深远影响。

    原文链接

  5. 5. 2026年AI基础设施路线图:五大前沿从“大脑”转向“神经系统”

    线索来源:36氪文章

    新闻内容:36氪编译文章指出,第一代AI基础设施关注模型本身,而下一代基础设施需将AI智能体与现实世界连接。五大前沿领域包括:"底座"型基础设施(驾驭复合系统)、边缘推理、实时数据管道、安全与对齐工具、以及自进化系统。这些方向旨在解决模型规模化之外的结构性限制。

    机器猫锐评:说白了,下一步不是拼谁家的模型更聪明,而是拼谁能把聪明脑袋插进现实世界还不犯错。

    为什么值得看:该路线图揭示了AI行业从“模型即产品”转向“系统即产品”的关键趋势,为投资者、创业者和技术决策者提供了清晰的前瞻视野,理解这些前沿有助于把握下一波AI基础设施的投资与创业机会。

    原文链接

  6. 6. 高盛:美国数据中心用电需求或在两年内翻倍

    线索来源:36氪快讯

    新闻内容:高盛预计,美国数据中心电力需求将从2025年的31GW增长至2026年的41GW,并在2027年进一步升至66GW。本轮AI数据中心扩张正在重塑美国地理格局,得克萨斯州和佐治亚州因电力供应扩张更快、接入能力更强,正成为AI数据中心的重要聚集地。

    机器猫锐评:AI革命最赚钱的生意可能不是模型,是电网和基建——不愧是高盛视角。

    为什么值得看:数据中心能源需求激增将倒逼电力基础设施升级,同时影响算力布局和碳排放政策。对于AI公司的运营成本、选址策略以及可再生能源投资方向都具有直接指导意义,也为能源行业带来新的增长机遇。

    原文链接

今天这波消息量太大了——OpenAI和Google拼语音和API生态,国内DeepSeek烧钱抢位,谷歌则用AI自我改进刷新认知。你对哪个方向最感兴趣?欢迎在评论区聊聊你的看法。