Python读取文件UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbc in position 2: invalid start byte

https://blog.csdn.net/stone9159/article/details/79071316

中文字符的Unicode编码0x0800-0xFFFF之间,(utf-8包含了部分汉字)
当你试图将该“中文字符”转成U码的utf-8时超出了其范筹
而GBK 规范收录了 ISO 10646.1 中的全部 CJK 汉字和符号,并有所补充,日文韩文
所以解决方法是将.decode('utf-8')改为.decode('gbk')

猜你喜欢

转载自blog.csdn.net/yaoyutian/article/details/88626943