python写入html文件中文乱码-解决办法 - 代码天地

python写入html文件中文乱码-解决办法

其他 2019-04-18 17:32:05 阅读次数: 0

python写入html文件中文乱码问题

使用open函数将爬虫爬取的html写入文件，有时候在控制台不会乱码，但是写入文件的html中的中文是乱码的

案例分析

看下面一段代码：

# 爬虫未使用cookiefrom urllib import requestif __name__ == '__main__':    url = "http://www.renren.com/967487029/profile"    rsp = request.urlopen(url)    html = rsp.read().decode()    with open("rsp.html","w")as f:        # 将爬取的页面        print(html)        f.write(html)
   
   
    
    1
    
    2
    
    3
    
    4
    
    5
    
    6
    
    7
    
    8
    
    9
    
    10
    
    11
    
    12
    
    13
    
    14

看似没有问题，并且在控制台输出的html也不会出现中文乱码，但是创建的html文件中
这里写图片描述

解决方案

使用open方法的一个参数，名为encoding=” “，加入encoding=”utf-8”即可

# 爬虫未使用cookiefrom urllib import requestif __name__ == '__main__':    url = "http://www.renren.com/967487029/profile"    rsp = request.urlopen(url)    html = rsp.read().decode()    with open("rsp.html","w",encoding="utf-8")as f:        # 将爬取的页面        print(html)        f.write(html)
   
   
    
    1
    
    2
    
    3
    
    4
    
    5
    
    6
    
    7
    
    8
    
    9
    
    10
    
    11
    
    12
    
    13
    
    14

运行结果

这里写图片描述
之前写过一篇关于爬虫编程的常见错误：
https://blog.csdn.net/qq_40147863/article/details/81673694
但是编码问题很让人头疼，所以写了一篇独立的，且后续也可能会在本篇继续更多的编码问题

- 本笔记不允许任何个人和组织转载

猜你喜欢

转载自blog.csdn.net/qq_44906554/article/details/89342325

python写入html文件中文乱码-解决办法

Android 文件下载中文名乱码的解决办法

IDEA国际化文件中文乱码的解决办法

hadoop读取hdfs文件中的中文乱码解决办法

NotePad 打开文件出现中文汉字乱码解决办法

VSCode打开.c文件出现中文乱码解决办法

python中文画图显示乱码解决办法

python 读取 csv 中文乱码解决办法

python写入csv文件中文乱码解决方案

解决Python将数据写入csv文件中文乱码

python logging模块写入中文，文件乱码的解决方法

Linux中文乱码解决办法

SecureCRT 中文乱码解决办法

MySql中文乱码解决办法

git中文乱码解决办法

Rhythmbox中文乱码解决办法

mysql保存中文乱码的解决办法

20 中文乱码解决办法

linux 中文显示乱码解决办法

CentOS中文乱码解决办法

mysql 中文乱码解决办法总结

Debian中文乱码解决办法

Servlet之中文乱码的解决办法

mysql中文乱码最全解决办法

RestClient的request中文乱码的解决办法

关于SpringMVC中文乱码的解决办法

JFreeChart中文乱码的解决办法

TZipFile FileNames中文乱码解决办法

Android studio 中文乱码的解决办法

sql developer 中文乱码解决办法

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)