爬虫-处理html的转义字符

爬到的书店的名称里面有如下情况:

这是HTML转义字符的原因导致的,

如下:

解决方法

方法一-----------------------采用正则---如下,有问题,这样变成一个一个字符了,还要进行拼接处理

方法二--------------------使用html模块里面的方法-html.unescape()

欧克

猜你喜欢

转载自www.cnblogs.com/taoHongFei/p/9238947.html