已解决(Python读取csv文件报错)UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xa1 in position 0: invalid start byte
报错代码
我的代码:
import pandas as pd
import numpy as np
df = pd.read_csv('test.csv')
print(df)
报错信息:
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xa1 in position 0: invalid start byte
报错原因
报错内容翻译:
UnicodeDecodeError:“utf-8”编解码器无法解码位置0中的字节0xa1:起始字节无效
报错原因:CSV文件不是UTF-8进行编码,而是用gbk进行编码的。
解法方法
解决方法(1):
-
1.选中csv文件 -》鼠标右键 -》打开方式 -》 选择记事本
-
2.打开文件选择 “文件” -》"另存为“,我们可以看到默认编码是:
ANSI
-
3. 选择UTF-8点击保存,再使用再次运行程序就不会报错了
解决方法(2):修改代码的编码格式为gbk
import pandas as pd
import numpy as np
df = pd.read_csv('test.csv',encoding="gbk")
print(df)
再次运行成功: