bs4解析器有哪些(bs4解析xml)

bs4解析器有哪些(bs4解析xml)svg xmlns http www w3 org 2000 svg style display none svg

大家好,我是讯享网,很高兴认识大家。



 <svg xmlns="http://www.w3.org/2000/svg" style="display: none;"> <path stroke-linecap="round" d="M5,0 0,2.5 5,5z" id="raphael-marker-block" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);"></path> </svg> 

讯享网

安装:

1.bs4遍历文档树
bs4:解析xml格式的模块,从xml中找想要的数据。
html是xml的一种,解析html,使用requests返回的数据,可能是json、html、文件,再使用bs4解析html格式。

用法:

讯享网

注:lxml比html.parser速度块,但是需要安装lxml模块()

2.bs4搜索文档树
搜索文档树速度是比遍历慢一些的。

用法:

 

案例:


讯享网

讯享网

3.bs4其他用法
遍历和搜索,可以混合用
recursive :是否递归查找
limit:查找多少条


用法:

 

补充:
1 链式调用(跟语言没关系)

讯享网

2 bs4支持修改文档树,对爬虫没用,对实际写后台代码有用

3 主流软件的配置文件方式
xxx.conf(redis,nginx)
xxx.ini(mysql)
xxx.xml(uwsgi,java的配置文件居多)
xxx.yaml



4 css选择器
所有解析库,通常会有自己的查找方式(bs4就是find和find_all),还会支持css和想xpath选择。
记住一些css选择器用法:

id#
类名.
标签名p
标签名&gt;标签名 紧邻的子
标签名 标签名 子子孙孙



 

5 xpath:在xml中查找文档的语言

6 css、xpath都不会写怎么办
终极大招:浏览器F12选中页面元素,鼠标右击选择xpath或css复制即可~~
示例:

讯享网


小讯
上一篇 2025-05-23 18:18
下一篇 2025-05-14 08:14

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/155591.html