python批量操作txt文件并修改其中内容 - 代码天地

python批量操作txt文件并修改其中内容

其他 2020-10-25 02:39:02 阅读次数: 0

任务要求

对大量txt格式的小说删除其中网址

解决思路:

列出目录下的全部文件

读取文件

将文件中网址替换(全为中文小说，可直接替换掉英文)

写入新文件

删除旧文件

源码

import re
import os
txtlist=os.listdir("C:\\Users\SAMSUNG\PycharmProjects\LoadBaiDu\\txt\\novel") #列出目录下的全部文件
for d in txtlist:
    if(d.endswith("t")):
        file=open("novel\\"+d,"r",encoding="gbk",errors="ignore") #编码问题
        file1=open("novel\\ "+d,"w")
        for i in file.readlines():
            file1.write(re.sub(r"[a-zA-z]","",i)) #正则表达式匹配字母
        file1.close()
        file.close()
        print(d)
        os.remove("novel\\"+d)

问题解决

用python的时候经常会遇到文本的编码与解码问题，其中很常见的一种解码错误如题目所示，下面介绍该错误的解决方法，将‘gbk’换成‘utf-8’也适用。
（1）、首先在打开文本的时候，设置其编码格式，如：open(‘1.txt’,encoding=’gbk’)；
（2）、若（1）不能解决，可能是文本中出现的一些特殊符号超出了gbk的编码范围，可以选择编码范围更广的‘gb18030’，如：open(‘1.txt’,encoding=’gb18030’)；
（3）、若（2）仍不能解决，说明文中出现了连‘gb18030’也无法编码的字符，可以使用‘ignore’属性进行忽略，如：open(‘1.txt’,encoding=’gb18030’，errors=‘ignore’)；
（4）、还有一种常见解决方法为open(‘1.txt’).read().decode(‘gb18030’,’ignore’)

猜你喜欢

转载自blog.csdn.net/skylibiao/article/details/103465795

python批量操作txt文件并修改其中内容

Python实现批量修改并替换txt文本中内容

Python批量修改Excel中的文件内容

python批量修改txt文件,csv文件编码格式

批量修改文件内容

python批量修改txt文件里的类别数，批量修改文件名

python修改txt文件内指定列的内容

Python批量读取txt文件

py 批量修改文件内容

使用python批量修改xml文件中的节点内容！

Python txt文件操作

Python - 操作txt文件

Python 批量修改txt、json或xml格式样本标签文件的label字段名称

批量将Txt文件内容拆分成Excel文件

python 文件操作（二）替换性修改文件内容

python文件流使txt文件内容替换

python修改文件内容

python文件内容修改

python 修改文件内容

python读取txt批量创建文件

Python 关于txt文件操作

Python批量修改文件夹及其子文件夹下的文件内容

python 批量修改字符串（文件夹名称、文件名称、文件内容）

按模板批量修改Excel文件内容

基于命令的批量修改文件内容

批量修改多个文件内容的脚本

ubuntu系统批量修改文件内容

Linux批量修改多个文件的内容

python3.5中对文件的指定内容的修改操作

python 对其他文件内容进行修改操作

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)