本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
- 🚀 魔都架构师 | 全网30W技术追随者
- 🔧 大厂分布式系统/数据中台实战专家
- 🏆 主导交易系统百万级流量调优 & 车联网平台架构
- 🧠 AIGC应用开发先行者 | 区块链落地实践者
- 🌍 以技术驱动创新,我们的征途是改变世界!
- 👉 实战干货:编程严选网
Anthropic 为 Claude Code 推出了一项新的 Code Review 功能,引入基于智能体的拉取请求(PR)审查系统。该系统通过多个 AI 审查“代理”来分析代码变更。目前,这项功能以研究预览版形式向团队版和企业版用户开放。
当开发者创建拉取请求时,系统会自动启动,并同时调度多个智能体并行检查代码变更。Anthropic 表示,这些智能体会查找潜在 bug,对发现的问题进行二次验证以减少误报,并按照严重程度对问题排序,最终在 PR 中生成汇总评审和逐行评论。
Anthropic 指出,分配的智能体数量会根据 PR 的规模和复杂度动态调整。改动越大、越复杂,分析就越深入;而较小的改动则进行相对轻量的审查。公司称平均审查时间大约为 20 分钟。
在内部使用方面,Anthropic 表示过去几个月中,大多数自家 PR 都已经采用了该系统。公司数据显示,启用后,包含实质性评审意见的 PR 占比从 16% 提升到了 54%。对于修改超过 1000 行的 PR,有 84% 能检测出问题,平均发现 7.5 个;而修改少于 50 行的 PR 中,有 31% 检测出问题,平均约 0.5 个。
Anthropic 还表示,在内部使用过程中,被工程师标记为错误的审查结果不到 1%。同时强调,这一工具是用来辅助人类审查,而不是取代人类,也不会自动批准 PR。
社区反馈 总体较为积极,开发者普遍认为其分析深度和多智能体架构是区别于其他轻量级 AI 审查工具的亮点。不过也有评论指出,价格可能会限制小团队的使用;还有人质疑,对于高频开发流程来说,每个 PR 约 20 分钟的审查时间和 15–25 美元的成本是否现实。
AI 研究员 Nir Zabari 评论道:
听起来不错,但没有提供任何技术细节(比如每个并行智能体具体负责什么),也没有解释为什么比其他工具更好,只是提到成本在 15–25 美元之间(按当前 Opus 定价,大约相当于 300 万 token)。换句话说,这类功能或许更适合开源实现……
与此同时,用户 @rohini 表示:
Claude 写代码、再由 Claude 自己来审查?这甚至达不到最基本的安全标准。
此次发布让 Anthropic 更直接地进入 AI 代码审查市场。目前,像 GitHub Copilot 代码审查 和 CodeRabbit 等工具,已经提供了自动化 PR 分析能力。Anthropic 的差异化在于其多智能体审查架构,以及强调更深入但相对更慢的分析方式,而不是快速、轻量的审查流程。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/269696.html