Python OS文件批量处理之对比差异删除

需求:

这些天陆陆续续爬了近1TB的视频, 为什么是陆陆续续呢? 因为爬的目标网站太脆弱了, 加之各种玄

幻问题, 都不知道是哪方面的问题(异常处理能加的地方都加了)...

所以啊.程序重新启动好多次 , 加之我用的多线程&多进程,爬取每个index, 很难做到(根本不可能好吧(小声bb))第二次重新启动接着第一次停止的进度继续运行.  这就导致了三个文件夹里有好多相同的视频 , 白白占用了大量空间 , 

也很影响根据名称排序观看.

于是就使用OS库进行文件操作, 对两个文件夹名称相同的视频进行删除之一.

前言需求就是这些了..

那么代码思路呢 , ~ 哎, 就很简单了. 首先呢 , 先将用OS库的listdir方法,获取到含有两个文件夹里的所有文件的名称的列表list ; 

 之后就是小学生问题了, 将个列表遍历循环嵌套,进行字符串对比, 用 if 语句判断 如果相等则呢-

进行删除咯..os.remove(文件路径哈), 顺带打印一下, 好让你知道害群之马到底是谁啦

不相等,我想你知道该怎么做,

代码奉上:

from os import remove, listdir
PathOne = input("请输入文件数多的目录绝对路径(最后加上目录进访问符'/'或'\\'):")
PathTwo = input("请输入文件数少的目录绝对路径(最后加上目录进访问符'/'或'\\'):")

FileNamelist_One = listdir(PathOne)
FileNamelist_Two = listdir(PathTwo)

for itemone in FileNamelist_One:
    for itemtwo in FileNamelist_Two:
        if itemtwo == itemone:
            remove(PathTwo + f"{itemtwo}")
            print(f"{itemtwo}==>有重复已删除")
        else:
            continue
print("已全部校验完毕")
input("Press <Enter>")

最后啊 , 那个input语句是我后面打包成exe在cmd执行时, 这好家伙运行完就关了, 不让我仔细看看到底删了谁, 我就加了个input操作,把这个线程阻塞住哈,这样就能运行完停下,我一按回车再关...这也算是input操作的妙用吧..

猜你喜欢

转载自blog.csdn.net/superwang04/article/details/123688224