最近也试玩了下cursor,自动生成代码的功能确实好用又强大,起码对于日常运维要用的脚本足够了。具体的安装和用法网上教程很多,这里只侧重记录一些测试过程及小技巧。
之所以选择这个案例测试,一是因为有这个需求,二是因为之前简单学习过爬虫的课程,能明确对比,当时断断续续看了一周课程,而这个代码从萌生需求到实现和优化完成,不到半个小时,效率提升惊人。
- 对于较大较复杂的需求,先逐步拆解,逐步生成代码并验证。如果不知道怎么拆步骤,可以直接让cursor或者其他AI工具一步步先写出思路。
- 在提示词中让cursor给出代码中用到的依赖包或者软件安装方法,还可以进一步结合MCP Server,直接让它帮你装完及运行脚本
- 如果执行遇到报错,直接将报错代码输入给cursor并要求优化,测试的几次优化后的代码都能符合预期
- 可以将cursor生成的代码搬运给其他AI,让它们分别进行优化,直到得出相近的输出,作为最优解
- 对于生成的代码,如果看不懂,可以要求它给出注释甚至介绍每行代码含义,以通俗语言解释原理,对于快速学习代码很有帮助
我最终的目标是将本博客的所有文章备份至本地保存,拆解步骤大致是:
- 获取 Hehuyi_In-博客 博客中所有文档的链接(这里第一次cursor弄错了cs的页面渲染方式,没有获取成功,不过将报错提交给它后,立马就生成了正确的获取方法)
- 给出其中一篇的链接,以markdown形式将文章内容存储至本地
- 综合以上两段代码,获取 Hehuyi_In-博客 博客中所有文档内容,以markdown形式将文章内容存储至本地的article目录下
以上3段提示,其实cursor已经生成了能实现需求的代码,但运行过程中还发现两个优化点:
- 单线程执行,效率过低
- 执行过于频繁,基本抓取到100篇左右,就会被反爬禁掉,直接报超时
针对以上两点,cursor一是引入了线程池,二是增加了爬取间隔时间,最终成功抓取~
1. 生成代码
2. 实现效果

pycharm本身可以打开.md格式文件,效果如下

后续能想到的一些优化点:
- 执行效率:目前抓取600多篇文章耗时约5分钟,这个速度绝对有提升空间
- 增量获取:脚本定期运行,每当我新增、修改了文章内容,自动备份至本地
- 范围扩展:输入任何一个blog名称或ID,自动获取其所有博客内容;理论上不仅局限于博客,它应该能扩展到获取各种不同网站的内容
- 知识库构建:内容足够丰富后,结合cursor的codebase功能,实现个人AI知识库构建
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/225227.html