python处理文件首行的BOM问题

这个问题之前一直放过,烦了好久了,

用python的readlines方法读文件,首行总是会因为有一个小短横而报错。

在pycharm里就是这个样子,把那行复制出来又看不到小短横了。


这是文件首行的BOM在作祟。

UTF-8编码文件可分为utf-8和utf-8 without BOM两种,

可以用编辑器另存为utf-8 without BOM,也可以在代码中采用codecs.open来处理

# -*- coding: UTF-8 -*-
import codecs
with codecs.open("WikiData.txt", 'r', 'utf-8-sig') as in_file:
    for line in in_file.readlines():
        ...


猜你喜欢

转载自blog.csdn.net/XiaoPANGXia/article/details/53542443