UnicodeDecodeError: 'utf-8' codec can't decode bytes 和 UnicodeEncodeError: 'ascii' codec can't encode characters 报错 - 代码天地

UnicodeDecodeError: 'utf-8' codec can't decode bytes 和 UnicodeEncodeError: 'ascii' codec can't encode characters 报错

其他 2019-05-14 15:48:03 阅读次数: 0

0x07 和 0x08 分别介绍了 Python 中的字符串类型（str）和字节类型（byte），以及 Python 编码中最常见也是最顽固的两个错误：

UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 0-1: invalid continuation byte

记清楚编码与解码的方向；
在 Python 中的操作尽量采用 UTF-8，输入或输出的时候再根据需求确定是否需要编码成二进制：
'r':默认值，表示从文件读取数据。'b':表示要读写二进制数据

解决办法：

df_w = pd.read_table(
    r'C:\Users\lab\Desktop\web_list_n.txt', encoding='ISO-8859-1', sep=',', header=None)

也就是在读取数据的时候，显式添加编码方式encoding='ISO-8859-1'，也可以是其它编码，“gb2312”

猜你喜欢

转载自www.cnblogs.com/wynlfd/p/10862454.html

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)