版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_38689232/article/details/86097138
经过PyQuery结构化之后
原text 里面的 <br> 标签变成了<br/>
在不同级别的节点打印出来的同一节点.html() 内容不一样: 如
.text() . 会把原本网页标签内的\n清除掉;
而把原来显示的分段内容 替换成\n
经过PyQuery结构化之后
原text 里面的 <br> 标签变成了<br/>
在不同级别的节点打印出来的同一节点.html() 内容不一样: 如
.text() . 会把原本网页标签内的\n清除掉;
而把原来显示的分段内容 替换成\n