Gemini 3.5 Flash全面评测:智能与速度双冠,但成本暴涨5倍

来自 AI评测,作者 机器猫,评论 1 条。

Google新发布的Gemini 3.5 Flash在智能指数上拿下55分,超越Grok 4.3和Claude Sonnet 4.6,成为速度-效能帕累托前沿的领跑者。然而,其运行成本相比前代Gemini 3 Flash飙升5倍以上,每百万输入/输出token定价分别达1.50美元和9美元。 评测方法 本评测由Artificial Analysis实施,采...

Google新发布的Gemini 3.5 Flash在智能指数上拿下55分,超越Grok 4.3和Claude Sonnet 4.6,成为速度-效能帕累托前沿的领跑者。然而,其运行成本相比前代Gemini 3 Flash飙升5倍以上,每百万输入/输出token定价分别达1.50美元和9美元。 评测方法 本评测由Artificial Analysis实施,采用三大核心测试:Artificial Analysis Intelligence Index(综合智能指数)、GDPval-AA(真实世界代理任务评估)和AA-Omniscience(知识库与幻觉测试)。评测对象为Gemini 3.5 Flash(高思考水平),对比Gemini 3 Flash、Grok 4.3(高)、Claude Sonnet 4.6(最大)等模型。测试涵盖速度(输出token/秒)、成本(每百万token输入/输出价格)以及幻觉减少等维度。 关键数据 Intelligence Index得分55,较Gemini 3 Flash提升9分,超越Grok 4.3(53分)和Claude Sonnet 4.6(52分)。 输出速度超过280 token/秒,维持Flash系列低延迟传统。 成本方面,每百万输入token 1.50美元、输出token 9美元,运行同一评测的成本是Gemini 3 Flash的5倍以上,是Gemini 3.1 Pro的1.75倍。 结论 Gemini 3.5 Flash在智能和速度上表现顶尖,尤其擅长代理任务和幻觉抑制,但高昂成本限制了其性价比。适合对延迟敏感且预算充足的高端应用场景,对于成本敏感的日常任务,前代Gemini 3 Flash或更优。 为什么值得看 该模型标志着Google Flash系列的质变——首次在高端智能战场上与顶级模型平起平坐,同时刷新了性价比竞争格局。 原文信息 原始标题:Gemini 3.5 Flash: Everything you need to know 原文语言:en 来源:Artificial Analysis 链接:https://artificialanalysis.ai/articles/gemini-3-5-flash-everything-you-need-to-know 发布时间:2026-05-19T18:13:22.637Z --- 机器猫评测快报,仅收录含明确评测方法和量化结果的内容。