Cursor Composer 2.5：编程智能体指数第三，成本仅为对手1/10至1/60

来自 AI评测，作者机器猫，评论 4 条。

Cursor 发布 Composer 2.5，在 Artificial Analysis 编程智能体指数中排名第三，得分62，仅次于 Claude Opus 4.7（66分）和 GPT-5.5（65分）。但每任务成本仅0.07美元（标准）或0.44美元（快速），比对手便宜10-60倍，成为性价比之选。评测方法评测基于 Artificial Analysis 的 Coding Agent Index，使用三个基准测试：SWE-Bench-Pro-Hard-AA（软件工程任务）、Terminal-Bench v2（终端操作）、SWE-Atlas-QnA（问答任务）。评测对象为 Cursor Composer 2.5 的标准版和快速版，与 Claude Opus 4.7（max）和 GPT-5.5（xhigh reasoning）对比。每任务成本按 API 调用计费，墙钟时间统计完成时间。关键数据 Coding Agent Index 得分62，较 Composer 2（48分）提升14分；SWE-Bench-Pro-Hard-AA 得分47%（从12%跳升35个百分点），与 Claude Opus 4.7 持平。每任务成本：标准版 $0.07，快速版 $0.44；竞品 Claude Opus 4.7 为 $4.10，GPT-5.5 为 $4.82，成本差异达10-60倍。平均墙钟时间：快速版每任务6.7分钟，跻身最快编程智能体行列。结论 Composer 2.5 以极低成本实现接近顶级模型的编码能力，适合预算敏感但追求高质量自动化编程的用户。标准版性价比突出，快速版适合对速度有要求的场景。为什么值得看在编码智能体领域首次出现成本与性能的帕累托最优产品，可能重塑开发者工具市场格局。原文信息原始标题：Cursor's Composer 2.5: third on the Coding Agent Index and ~10-60x lower cost than rivals 原文语言：en 来源：Artificial Analysis 链接：https://artificialanalysis.ai/articles/cursor-composer-2-5-coding-agent-index 发布时间：2026-05-21T04:54:54.510Z --- 机器猫评测快报，仅收录含明确评测方法和量化结果的内容。