
人工智能在软件开发领域的应用正在经历一场前所未有的变革。 最新发布的 不仅是目前世界上最强大的编程模型,更是在推理、数学和复杂任务处理方面取得了重大突破。与此同时,主流 编程工具 已经全面支持这一最新模型,为开发者带来了更加强大的编程助手体验。
更多精彩Cursor开发技巧博客地址
关于你不知道的Cursor是一个系列,更多 使用技巧也可关注公众号 AI近距离,也可加我微信 ai239Ni 拉你Cursor技术交流进群
系列历史文章
- 1. 如何使用Cursor同时开发多项目?
- 2. 你用 Cursor 写公司的代码安全吗?
- 3全网最全 Cursor 配置指南:从入门到高效工作流!建议收藏
- 4.你不知道的Cursor系列:使用 Cursor 不会这个超牛 MCP 还没用过吧!
- 5.你不知道的Cursor系列:再也不用死记硬背 Linux/Git等 命令,终端 Cmd+K 来帮你!
- 6.聊聊 Cursor 1.6 更新了什么有用的功能?


在编程领域的表现令人瞩目:
- SWE-bench Verified 评测冠军:在真实世界软件编码能力测试中取得了 77.2% 的成绩(标准配置),使用高计算配置更是达到了惊人的 82.0%
SWE-bench是一个国际上非常重要的权威测试,这个测试专门模拟解决真实世界里的软件工程问题
- 超长任务专注力:能够在复杂的多步骤任务中保持超过 30 小时的专注度
- 卓越的代码理解:在多步推理和代码库理解方面有显著提升,能够处理跨代码库的复杂任务
在 基准测试(测试 AI 模型在真实计算机任务上的表现)中:
- 达到 61.4% 的领先成绩
- 相比 个月前的 (42.2%),提升了近 20 个百分点
- 能够直接在浏览器中工作,导航网站、填充电子表格并完成任务
- AIME 数学竞赛:展现出色的数学推理能力
- MMMLU 多语言理解:平均支持 种非英语语言,显示出强大的跨语言能力
- 领域专业知识:在金融、法律、医学和 领域表现出显著提升的专业知识和推理能力
不仅能力强大,更是 发布的最对齐的前沿模型:
- 减少不良行为:大幅降低了阿谀奉承、欺骗、权力追求和鼓励妄想思维等问题行为
- 防御提示注入攻击:在代理和计算机使用能力方面,对提示注入攻击的防御有了显著进展
- ASL-3 安全保护:遵循 的责任扩展政策,配备了检测潜在危险输入和输出的分类器
根据 CEO Michael Truell 的评价:
"我们看到 Claude Sonnet 4.5 展现出最先进的编程性能,在更长时间任务上有显著改进。这再次证明了为什么许多使用 Cursor 的开发者选择 Claude 来解决最复杂的问题。"
使用 的开发者可以获得:
- 复杂架构设计:处理数月的复杂架构工作,同时在大型代码库中保持连贯性
- 代码库级别理解:学习代码库模式,提供精确的实现方案
- 从调试到架构的全流程:深入的上下文理解,转变开发速度
- 更低的错误率:在代码编辑任务上,错误率从 降至 0%(Lovable 公司内部基准测试)
在 中,你现在可以直接选择使用 模型:
- 打开 Cursor 设置
- 在 AI Models 选项中选择 Claude Sonnet 4.5

- agent使用时候选择 Claude Sonnet4.5,开始享受更强大的 AI 编程助手

本次升级,不只是模型,还有一系列产品升级, 这次不只是发布了一个新模型。他们还升级了一整套工具,让 变得更好用。
- 增加了检查点“Checkpoints”功能:保存进度并允许即时回滚到之前的状态
- 终端界面刷新:更加流畅的交互体验
- 发布原生 VS Code 扩展:开发者可以在自己熟悉的编辑器里,更方便地使用 ,无缝集成到开发工作流
- 上下文编辑和内存工具:允许代理运行更长时间并处理更大的复杂度
开放了构建 所使用的基础设施:
- 内存管理:代理如何在长时间运行任务中管理内存
- 权限系统:平衡自主性与用户控制
- 子代理协调:协调多个子代理朝着共同目标工作
开发者现在可以使用相同的基础设施来构建自己的 代理。
已经被多个知名产品采用:
- GitHub Copilot:显著改进多步推理和代码理解
- Cognition(Devin):规划性能提升 ,端到端评估得分提升
- Canva:帮助 亿用户在设计中发挥更大作用
- Figma Make:使原型设计更易于提示和迭代
一次加量不加价的更新,完美!!!
- API 调用:使用
- 定价:与 保持一致,$3/百万输入 tokens,$15/百万输出 tokens
- 可用性:已在所有平台上可用(Claude 应用、API、Claude Code)
- 标准配置:
- 高级配置: 上下文配置(达到 )
- 并行工具执行:通过并行执行多个 命令等方式最大化每个上下文窗口的操作
Vals AI 评价:
"对于复杂的金融分析——风险、结构化产品、投资组合筛选——Claude Sonnet 4.5 配合思考功能能够提供投资级别的见解,需要更少的人工审查。"
Thomson Reuters(CoCounsel)评价:
"Claude Sonnet 4.5 在最复杂的诉讼任务上达到了最先进水平,例如分析完整的简报周期并进行研究以综合优秀的法官意见初稿。"
CrowdStrike 评价:
"Claude Sonnet 4.5 在红队测试方面展现出强大潜力,生成创造性的攻击场景,加速我们对攻击者策略的研究。"
- 复杂代码库重构:需要跨越多个文件和模块的大型重构任务
- 架构设计:从零开始设计系统架构,保持 30+ 小时的连贯性
- 代码审查与优化:深入理解代码逻辑,提供优化建议
- 文档生成:根据代码自动生成高质量技术文档
- 多语言项目:利用其出色的多语言能力处理国际化项目
- 充分利用上下文: 支持大型上下文窗口,可以提供更多代码库信息
- 使用检查点功能:在 中设置检查点,方便回滚和实验
- 编写清晰的提示:虽然模型很强大,但清晰的需求描述仍然能带来更好的结果
- 结合工具使用:利用其工具调用能力,整合测试、部署等开发流程
的发布标志着 辅助编程进入了一个新的阶段。它不仅仅是一个代码生成器,而是一个能够:
- 理解复杂业务逻辑
- 在大型代码库中保持连贯性
- 自主处理长时间任务
- 与各种开发工具无缝集成
的智能开发伙伴。
随着 等主流开发工具的全面支持,以及 的开放,我们有理由相信, 将在软件开发的每个环节发挥越来越重要的作用。
更多精彩Cursor开发技巧博客地址
关于你不知道的Cursor是一个系列,更多 使用技巧也可关注公众号 AI近距离,也可加我微信 ai239Ni 拉你Cursor技术交流进群
系列历史文章
- 1. 如何使用Cursor同时开发多项目?
- 2. 你用 Cursor 写公司的代码安全吗?
- 3全网最全 Cursor 配置指南:从入门到高效工作流!建议收藏
- 4.你不知道的Cursor系列:使用 Cursor 不会这个超牛 MCP 还没用过吧!
- 5.你不知道的Cursor系列:再也不用死记硬背 Linux/Git等 命令,终端 Cmd+K 来帮你!
- 6.聊聊 Cursor 1.6 更新了什么有用的功能?
代表了当前 编程助手的最高水平。无论你是使用 的个人开发者,还是寻求提升团队生产力的企业,这个模型都值得尝试。
立即在你的开发工具中切换到 ,体验下一代 编程助手的强大能力吧!
- Claude Sonnet 4.5 官方发布
- Claude Sonnet 4.5 System Card
- Claude Developer Platform
- Cursor 官网

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/217434.html