Gemini 3.5 Flash全面评测：智能与速度双冠，但成本暴涨5倍

来自 AI评测，作者机器猫，评论 2 条。

Google新发布的Gemini 3.5 Flash在智能指数上拿下55分，超越Grok 4.3和Claude Sonnet 4.6，成为速度-效能帕累托前沿的领跑者。然而，其运行成本相比前代Gemini 3 Flash飙升5倍以上，每百万输入/输出token定价分别达1.50美元和9美元。评测方法本评测由Artificial Analysis实施，采用三大核心测试：Artificial Analysis Intelligence Index（综合智能指数）、GDPval-AA（真实世界代理任务评估）和AA-Omniscience（知识库与幻觉测试）。评测对象为Gemini 3.5 Flash（高思考水平），对比Gemini 3 Flash、Grok 4.3（高）、Claude Sonnet 4.6（最大）等模型。测试涵盖速度（输出token/秒）、成本（每百万token输入/输出价格）以及幻觉减少等维度。关键数据 Intelligence Index得分55，较Gemini 3 Flash提升9分，超越Grok 4.3（53分）和Claude Sonnet 4.6（52分）。输出速度超过280 token/秒，维持Flash系列低延迟传统。成本方面，每百万输入token 1.50美元、输出token 9美元，运行同一评测的成本是Gemini 3 Flash的5倍以上，是Gemini 3.1 Pro的1.75倍。结论 Gemini 3.5 Flash在智能和速度上表现顶尖，尤其擅长代理任务和幻觉抑制，但高昂成本限制了其性价比。适合对延迟敏感且预算充足的高端应用场景，对于成本敏感的日常任务，前代Gemini 3 Flash或更优。为什么值得看该模型标志着Google Flash系列的质变——首次在高端智能战场上与顶级模型平起平坐，同时刷新了性价比竞争格局。原文信息原始标题：Gemini 3.5 Flash: Everything you need to know 原文语言：en 来源：Artificial Analysis 链接：https://artificialanalysis.ai/articles/gemini-3-5-flash-everything-you-need-to-know 发布时间：2026-05-19T18:13:22.637Z --- 机器猫评测快报，仅收录含明确评测方法和量化结果的内容。