xpath 使用方法（starts-with）匹配头 - 代码天地

xpath 使用方法（starts-with）匹配头

其他 2018-05-08 07:26:13 阅读次数: 3

html_doc = '''
 <html>
    <head>
        <title>
             The Dormouse's story
        </title>
    </head>
    <body>
        <p class="title">
            <b>
                The Dormouse's story
            </b>
        </p>
        <p class="story">
            Once upon a time there were three little sisters; and their names were
            <a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>
            <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>
            and
            <a class="sister" href="http://example.com/tillie" id="link2">Tillie</a>
            and they lived at the bottom of a well.
        </p>
        <p class="story">
            测试中文
        </p>
        <ul>
            <li> python </li>
            <li> C# </li>
            <li> java </li>
            <li> .net </li>
        </ul>
    </body>

 </html>
'''
from lxml import etree
'''
from 解析正文 import html_doc 导入解析内容即（html）
from lxml import etree  使用Xpath 所依赖的包
'''
# print(html_doc)
etr = etree.HTML(html_doc)  #创建解析对象 html 对象
a_like=etr.xpath('//p[@class="story"]/a[starts-with(@href,"http://example.com/")]/@href')
a_text=etr.xpath('//p[@class="story"]/a[starts-with(@href,"http://example.com/")]/text()')
'''
详细解析：
// 直接定位到 class 等于 story 的p 标签
/ 定位到 a 标签 并且 a 标签的href 属性 要以"http://example.com/" 开头
starts-with 可以用于其它地方 比如
p[starts-with(@class,"s")]   意思就是 寻找 p 标签的class 是s 的元素
'''
t_l=zip(a_text,a_like)
link_text={}
for l,t  in t_l:
    link_text.update({l:t})
print(link_text)
print(link_text.get('Elsie','没有'))

猜你喜欢

转载自blog.csdn.net/u012593871/article/details/80182213

xpath 使用方法（starts-with）匹配头

xpath使用方法详解id 、starts-with、contains、text()和last() 的用法

xpath之starts-with()

xpath定位中starts-with、contains、text()的用法

xpath 特殊用法 starts-with（），string(.)的学习笔记

xpath定位中starts-with、contains和text()的用法

Xpath使用方法

Selenium - Xpath 使用方法

Xpath的快速使用方法

xpath的contains使用方法

xpath定位中id、starts-with、contains、text()和last()的用法

xpath定位中详解id 、starts-with、contains、text()和last() 的用法

XPath 的使用

Xpath的使用

xpath使用

使用XPath

Python 使用xpath匹配html内容并生成CSV文件

python爬虫中xpath的使用方法

Selenium彩蛋篇-Xpath使用方法

Selenium学习之==>Xpath使用方法

python爬虫之xpath的使用方法

Python中xpath的简单使用方法

xpath helper安装和使用方法

Xpath高级使用方法(全网最全)

selenium-Xpath使用方法

XPath简介、功能及使用方法

爬虫--xpath匹配，requests库

XPath无法匹配tbody标签

xpath和contains模糊匹配

XPath匹配标签使用text()判断获取结果失败/为空的问题及解决方法

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)