Claude Opus 4.1 在 SWE-bench Verified 上将最佳编码性能提升至 74.5%,并提升了 Claude 的深入研究和数据分析能力,尤其是在细节跟踪和代理搜索方面。GitHub 指出,Claude Opus 4.1 相对于 Opus 4 在大多数功能方面都有所改进,尤其是在多文件代码重构方面性能提升尤为显著。 Rakuten Group 发现,Opus 4.1 擅长在大型代码库中精准定位更正,避免不必要的调整或引入错误。
Windsurf 报告称,Opus 4.1 在其初级开发人员基准测试中比 Opus 4 提高了一个标准差,其性能提升与从 Sonnet 3.7 到 Sonnet 4 的提升大致相同。要开始使用 Claude Opus 4.1,开发者只需通过 API 使用 claud-opus-4-1-20250805 即可。您还可以访问系统卡、模型页面、定价页面和文档,了解更多关于此次升级的信息。我们鼓励用户提供反馈,以帮助进一步改进模型。