UnicodeDecodeError: 'ascii' codec can't decode byte 0xe9 in position 0

最近在用Python处理中文字符串时,报出了如下错误:

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe9 in position 0

原因:

默认情况下,Python采用的是ascii编码方式,如下所示:

在命令行输入:
python -c "import sys; print(sys.getdefaultencoding())"

输出:
ascii

而Python在进行编码方式之间的转换时,会将 unicode 作为“中间编码”,但 unicode 最大只有 128 那么长,所以这里当尝试将 ascii 编码字符串转换成”中间编码” unicode 时由于超出了其范围,就报出了如上错误。

解决办法:
1)将Python的默认编码方式修改为utf-8,就可以规避上述问题的发生,在Python文件的前面加上如下代码:

import sys
defaultencoding = 'utf-8'
if sys.getdefaultencoding() != defaultencoding:
    reload(sys)
    sys.setdefaultencoding(defaultencoding)

2)在/usr/lib/python2.7/site-packages/目录下添加一个sitecustomize.py文件,内容如下:

import sys
sys.setdefaultencoding('utf-8')

# 这种方式可以解决所有项目的encoding问题

原文链接:
https://www.cnblogs.com/CasonChan/p/4669799.html
膜拜大佬~~

猜你喜欢

转载自blog.csdn.net/qq_35790269/article/details/81943450