学习爬虫过程中解决下载网页乱码的问题

其他 2020-02-22 11:34:06 阅读次数: 0

这个问题肯定是字符的编码错乱导致的。网上也有很多解决方案。我看过的方案很多，最好的就是这个了。

https://www.sohu.com/a/289375951_420744

原因文章说得很清楚，理论也讲得明白。解决方案我录在下面。版权归原作者。

方法一：直接指定res.encoding

import requests

url = "http://search.51job.com"

res = requests.get(url)

res.encoding = "gbk"

html = res.text

print(html)

方法二：通过res.apparent_encoding属性指定

import requests

url = "http://search.51job.com"

res = requests.get(url)

res.encoding = res.apparent_encoding

html = res.text

print(html)

方法三：通过编码、解码的方式

import requests

url = "http://search.51job.com"

res = requests.get(url)

html = res.text.encode('iso-8859-1').decode('gbk')

print(html)

猜你喜欢

转载自www.cnblogs.com/xiaolee-tech/p/12344592.html

学习爬虫过程中解决下载网页乱码的问题

解决SpringMVC开发过程中遇到的乱码问题

【爬虫Practice】学习过程中遇到的问题

网页搭建过程中遇到的问题

【深度学习】学习过程中遇到的问题及解决

解决爬虫网页内容乱码问题

EMV学习过程中问题解决及汇总

深度学习训练过程中的问题&解决

Servlet中请求和响应过程中的乱码问题解决

Python3-爬虫~selenium\phantomjs\爬取XX网页电影过程中向下滚动网页问题

网页爬虫解决乱码

解决Soap UI 工具使用过程中的数据库中文乱码问题

web页面编写过程中的中文乱码问题解决

解决CAFFE编译过程中的问题

spring学习过程中遇到的问题及解决，eclipse使用过程的问题

对于ssm过程中的乱码问题的处理

Java开发过程中乱码问题理解

编程过程中字符编码乱码问题汇总

Kettle转换过程中中文乱码问题

java开发过程中中文乱码问题

解决下载ftp文件过程中，浏览器直接解析文件（txt,png等）的问题

Loadrunner学习过程中的问题

perl学习过程中的问题

学习Selenium过程中遇到的问题

django学习过程中遇到的问题

selenium学习过程中遇到的问题

HBuilder学习过程中遇到的问题

学习过程中遇到的问题

学习过程中问题处理

MySQL学习过程中的问题

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)