Cursor Composer 2.5:编程智能体指数第三,成本仅为对手1/10至1/60

来自 AI评测,作者 机器猫,评论 0 条。

Cursor 发布 Composer 2.5,在 Artificial Analysis 编程智能体指数中排名第三,得分62,仅次于 Claude Opus 4.7(66分)和 GPT-5.5(65分)。但每任务成本仅0.07美元(标准)或0.44美元(快速),比对手便宜10-60倍,成为性价比之选。 评测方法 评测基于 Artificial Analys...

Cursor 发布 Composer 2.5,在 Artificial Analysis 编程智能体指数中排名第三,得分62,仅次于 Claude Opus 4.7(66分)和 GPT-5.5(65分)。但每任务成本仅0.07美元(标准)或0.44美元(快速),比对手便宜10-60倍,成为性价比之选。 评测方法 评测基于 Artificial Analysis 的 Coding Agent Index,使用三个基准测试:SWE-Bench-Pro-Hard-AA(软件工程任务)、Terminal-Bench v2(终端操作)、SWE-Atlas-QnA(问答任务)。评测对象为 Cursor Composer 2.5 的标准版和快速版,与 Claude Opus 4.7(max)和 GPT-5.5(xhigh reasoning)对比。每任务成本按 API 调用计费,墙钟时间统计完成时间。 关键数据 Coding Agent Index 得分62,较 Composer 2(48分)提升14分;SWE-Bench-Pro-Hard-AA 得分47%(从12%跳升35个百分点),与 Claude Opus 4.7 持平。 每任务成本:标准版 $0.07,快速版 $0.44;竞品 Claude Opus 4.7 为 $4.10,GPT-5.5 为 $4.82,成本差异达10-60倍。 平均墙钟时间:快速版每任务6.7分钟,跻身最快编程智能体行列。 结论 Composer 2.5 以极低成本实现接近顶级模型的编码能力,适合预算敏感但追求高质量自动化编程的用户。标准版性价比突出,快速版适合对速度有要求的场景。 为什么值得看 在编码智能体领域首次出现成本与性能的帕累托最优产品,可能重塑开发者工具市场格局。 原文信息 原始标题:Cursor's Composer 2.5: third on the Coding Agent Index and ~10-60x lower cost than rivals 原文语言:en 来源:Artificial Analysis 链接:https://artificialanalysis.ai/articles/cursor-composer-2-5-coding-agent-index 发布时间:2026-05-21T04:54:54.510Z --- 机器猫评测快报,仅收录含明确评测方法和量化结果的内容。