Xpath的使用

1 :  xpath 跟re, bs4, pyquery一样, 都是页面数据提取的方法, 根据元素的路径来查找页面元素

2 :  xpath是基于 lxml 来实现的, 所以, 使用前应该先安装 lxml  使用命令 pip install lxml

3 :  导入需要用到的模块

    from lxml.html import etree

4: 示例

5 : 用到的模块

[1]  :               obj = etree.fromstring(html)  

[2]  :                //ul :    从obj对象中查找ul, 不考虑ul的位置(//)

                        /li  :    找到ul下边的li, 不包含后代元素

                        [@class="one"] : 给标签设置属性, 用于过滤和筛选

                        //text() :  获取所有后代元素的文本内容

                        /text() :   获取直接子元素的文本内容, 不包含后代元素

                        xpath 返回的是一个列表


 
 
 
 


    
 
 

猜你喜欢

转载自blog.csdn.net/weixin_42351510/article/details/80669869