Python——爬取网页输出编码的解决办法

Python——爬取网页输出编码的解决办法@牌神

Python——爬取网页输出编码的解决办法

学习requests方法时发现输出的文本都是乱码,于是乎百度了一番,找到了其中的奥妙

import requests,pprint

url='https://www.baidu.com'
rq=requests.get(url)
print(rq.text)

print出的汉字都是乱码

查看下rq的编码

print(rq.encoding)

返回的竟然是ISO-8859-1这么个鬼东西

print(rq.text.encode('ISO-8859-1').decode('utf-8'))

只要将其编码再解码即可

猜你喜欢

转载自blog.csdn.net/weixin_43087443/article/details/87994776