python 文件读写以及json封装解析中出现了编码错误的解决方案

json格式:简单来说就是我们使用list将许多的dict类型的数据存起来,就是json格式
for examp:[dict1, dict2, dict3, dict4, dict5]
我们平时编写程序的时候正常的编程方式:

    with open(classified_file, 'r', encoding='utf-8') as f, open(keyword_label_info, 'w', encoding='utf-8') as f1:
        for i in f:
            data = json.loads(i)
            new_data = add_topic_keyword_info(data)
            f1.write(json.dumps(data, ensure_ascii=False)+'\n')

1、这里我们一定要注意,我们写入文件的时候需要将字典格式的数据进行第一步的json格式的转化,在转化的过程中我们这个时候就要注意ensure_ascii=True/False, 这个属性属性的默认值是True, 代表使用ascii编码,但是ascii编码我们看到的是我们看不懂的一段数字码,不能直观的看到中文信息,所以我们要想在写入文件之后是我们能够认识的中文,我们就要将这个属性修改成ensure_ascii=False,
2、 在修改了这个属性之后我们直接运行的话,会报以下错误:

'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

这是编码错误,但是可能经过你的多次验证之后发现python编译器和pycharm都是使用的utf-8,理论上不应该出现这样的编码错误,
经过我多次验证之后才发现了这个一个问题:就是文件进行读写的时候必须也要加上编码格式

with open(classified_file, 'r') as f, open(keyword_label_info, 'w') as f1:
        for i in f:
            data = json.loads(i)
            new_data = add_topic_keyword_info(data)
            f1.write(json.dumps(data, ensure_ascii=False)+'\n')
'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

以上是我们报错的那段代码,本篇第一个代码块是经过修改,不会出现乱码和报错的。

发布了12 篇原创文章 · 获赞 1 · 访问量 1589

猜你喜欢

转载自blog.csdn.net/qq_43031234/article/details/91049060
今日推荐