利用lxml解析库的etree.parse方法加载本地html文件的路径输入问题 - 代码天地

利用lxml解析库的etree.parse方法加载本地html文件的路径输入问题

其他 2018-05-07 16:12:15 阅读次数: 5

学习Matplotlib的时候，我也慢慢学习崔庆才的爬虫教程点击打开链接

其中有个需要利用lxml解析库的 etree.parse方法加载本地 ./test.html文本文件的例子。

(为什么其中的例子的文件名写成./test.html ？？多余的./是作什么的？百度无果，求大神解答下！感谢！)

代码参考如下：

from lxml import etree
html = etree.parse('./test.html', etree.HTMLParser())
result = etree.tostring(html)
print(result.decode('utf-8'))

运行后发生文件加载错误。

联想到上次“利用Python的 with open功能加载读取py本地当前目录文件问题”点击打开链接

于是代码中添加全路径文件地址，还是发生加载错误问题。

貌似显示文件目录地址输入方法不正确，于是再次参考error说明中的样式输入html文本地址。

from lxml import etree
html = etree.parse('D:/python3.6/scrapy/./test.html', etree.HTMLParser())
result = etree.tostring(html)
print(result.decode('utf-8'))

加载成功，解析成功。

本地测试用的 test.html 文本代码如下：

div
    ul
         li class=item-0a href=link1.htmlfirst itemali
         li class=item-1a href=link2.htmlsecond itemali
         li class=item-inactivea href=link3.htmlthird itemali
         li class=item-1a href=link4.htmlfourth itemali
         li class=item-0a href=link5.htmlfifth itema
     ul
 div

猜你喜欢

转载自blog.csdn.net/myself029/article/details/79954301

利用lxml解析库的etree.parse方法加载本地html文件的路径输入问题

python lxml中etree.html和etree.parse有什么区别

lxml解析本地HTML文件报错的问题

lxml.etree解析html

python中使用lxml的parse方法解析html文件报错Opening and ending tag mismatch

【python】xpath解析html文件报错：lxml.etree.XPathEvalError: Invalid expression

xpath解析html文件报错：lxml.etree.XPathEvalError: Invalid expression

lxml.etree.HTML(text) 解析HTML文档

python解析xml文件（sax、dom、etree）和lxml

lxml库中etree.HTML()和etree.tostring()用法

python IDE下可以导入lxml库下的etree函数，而pycharm无法导入lxml下的etree解决方法

lxml中etree.HTML()和etree.tostring()用法

python 使用 lxml.etree.HTML.xpath 解析网页不完整

lxml.etree.HTML()，lxml.etree.fromstring()和lxml.etree.tostring()三者的区别与联系

解决lxml无法导入etree的方法

解决lxml中没有etree的问题

Python解析xml文件，此实例将xml设置为模版（from lxml import etree）

python 3.6 lxml标准库lxml的安装及etree的使用注意

lxml库使用parse函数

python3.5的lxml中没有etree模块的问题解决方法

利用Python库urllib.parse对URL路径进行解析、拆分

python从入门到放弃篇25（lxml.etree库，urllib.request库，xpath方法，for循环构造xpath路径）爬取一刀999页面，并保存数据。

python从入门到放弃篇24（lxml.etree库，urllib.request库，xpath方法）爬取一刀999传奇页面，并将数据存储到本地计算机中。

HtmlAgilityPack类说明---Parse解析Html文件

python笔记28-lxml.etree爬取html内容

Python3：使用lxml库来解析xml文件和html文件(使用xpath方式解析)

一分钟解决python3中的lxml库中没有etree模块的问题

lxml包没有etree模块和parse报错处理

关于 conda中的 lxml 无法导入 etree 问题

网络爬虫 lxml库--解析和提取 HTML/XML 数据

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)