python文件相关操作

1.遍历目录

#遍历目录
import os
'''
os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])

top -- 是你所要遍历的目录的地址, 返回的是一个三元组(root,dirs,files)。

root 所指的是当前正在遍历的这个文件夹的本身的地址
dirs 是一个 list ,内容是该文件夹中所有的目录的名字(不包括子目录)
files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录)
topdown --可选,为 True,则优先遍历 top 目录,否则优先遍历 top 的子目录(默认为开启)。如果 topdown 参数为 True,walk 会遍历top文件夹,与top 文件夹中每一个子目录。

onerror -- 可选, 需要一个 callable 对象,当 walk 需要异常时,会调用。

followlinks -- 可选, 如果为 True,则会遍历目录下的快捷方式(linux 下是 symbolic link)实际所指的目录(默认关闭)。


'''
def file_walker(path):
    fileArray=[]
    for root,dirs,files in os.walk(path):
        for fn in files:
            eachpath=root+'\\'+fn
            fileArray.append(eachpath)
    return fileArray

file_walker('D:\有道\Dict')

2.创建文件

#创建文件夹
import os
import shutil

filepath='D:\\zhngsan'
def buildfile(filepath):
    if os.path.exists(filepath):
        shutil.rmtree(filepath)
        os.makedirs(filepath)
        
    else:
        os.makedirs(filepath)
        
    return filepath
buildfile(filepath)

3.读取EXCEL文件

import xlrd
def read_xls(path):
    xl = xlrd.open_workbook(path)
    sheet = xl.sheets()[0] # 0表示读取第一个工作表sheet
    data = []
    for i in range(0, sheet.ncols): # ncols表示按列读取
        data.append(list(sheet.col_values(i)))
    return data
# xlrd为第三方包,可以通过用pip下载,具体操作:打开运行,输入cmd→在cmd中输入pip install xlrd,enter →等待安装完成即可。在后续若存在需要使用的第三方包,都可以通过这种方式下载和安装。
# 传入参数为path,path为excel所在路径。
# 传入的path需如下定义:path= r’ D:\excel.xlsx’或path= r’ D:\excel.xls’
# col_values(i)表示按照一列中的所有单元格遍历读取
# 可以根据需求,把col替换成row,则表示按行读取
# return data :返回的data是一个二维数组,根据col和row,传回的数据呈现形式也不同,即row是col的转置。
 

---------------------

猜你喜欢

转载自blog.csdn.net/qq_35810838/article/details/82814366