爬取网页时出现了中文编码乱码的问题的解决方案

其他 2019-05-29 17:45:14 阅读次数: 0

在网站看到编码是utf-8的，但是出现了乱码，感觉肯定不是使用了utf-8的中文编码形式

import requests

r = requests.get('http://www.baidu.com/')

print (type(r)) # <class 'requests.models.Response'>

print (r.encoding) # ISO-8859-1

print (r.apparent_encoding) # GB2312 r.apparent_encoding是通过内容分析出的编码

print ((r.text.encode(r.encoding).decode(r.apparent_encoding))) # 返回不乱码的代码

猜你喜欢

转载自www.cnblogs.com/trunkslisa/p/10945153.html

爬取网页时出现了中文编码乱码的问题的解决方案

爬取网页时调用tostring()中文乱码解决方案

python爬取网页时，编码出错问题

scrapy 爬取https网页时出现ssl错误

python爬取网页中文乱码。解决方案。python3

爬取动态网页时遇到的问题

RStudio中，出现中文乱码问题的解决方案（修改文件编码）

爬取网页中文乱码的问题

MySql出现中文乱码问题的解决方案

JPS网页中文乱码解决方案

使用selenium的webdriver动态爬取网页时遇到的问题

Selenium使用PhantomJS来爬取动态网页时遇到的问题

matplotlib出现中文乱码的解决方案

python3.x+requests 爬取网站遇到中文乱码的解决方案

android渲染网页时onPageFinished不触发解决方案

Java爬取网页源码时乱码问题

pyspider爬网页出现中文乱码的解决办法

Servlet中文乱码问题的解决方案

CLion中文乱码问题的解决方案

爬取网页数据出现中文乱码 UTF-8中文乱码

Activiti中将Bpmn文件改为png文件时出现中文乱码解决方案

IE浏览器 ajax传参数值为中文时出现乱码的解决方案

爬虫爬取数据时各种中文乱码问题

使用WebStorm开发前端，网页中文乱码问题的解决方案

MySQL数据库中文编码乱码问题的解决方案

C++中的中文编码乱码的根源及解决方案

python爬取网页时返回http状态码HTTP Error 418 python爬取网页时返回http状态码HTTP Error 418

oracle数据库输入中文出现乱码的问题解决方案

Qtcreator使用msvc编译器出现中文乱码问题的解决方案参考

JDBC连接MySQL后出现中文字符乱码的问题及其解决方案

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)