1.遍历目录
#遍历目录
import os
'''
os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])
top -- 是你所要遍历的目录的地址, 返回的是一个三元组(root,dirs,files)。
root 所指的是当前正在遍历的这个文件夹的本身的地址
dirs 是一个 list ,内容是该文件夹中所有的目录的名字(不包括子目录)
files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录)
topdown --可选,为 True,则优先遍历 top 目录,否则优先遍历 top 的子目录(默认为开启)。如果 topdown 参数为 True,walk 会遍历top文件夹,与top 文件夹中每一个子目录。
onerror -- 可选, 需要一个 callable 对象,当 walk 需要异常时,会调用。
followlinks -- 可选, 如果为 True,则会遍历目录下的快捷方式(linux 下是 symbolic link)实际所指的目录(默认关闭)。
'''
def file_walker(path):
fileArray=[]
for root,dirs,files in os.walk(path):
for fn in files:
eachpath=root+'\\'+fn
fileArray.append(eachpath)
return fileArray
file_walker('D:\有道\Dict')
2.创建文件
#创建文件夹
import os
import shutil
filepath='D:\\zhngsan'
def buildfile(filepath):
if os.path.exists(filepath):
shutil.rmtree(filepath)
os.makedirs(filepath)
else:
os.makedirs(filepath)
return filepath
buildfile(filepath)
3.读取EXCEL文件
import xlrd
def read_xls(path):
xl = xlrd.open_workbook(path)
sheet = xl.sheets()[0] # 0表示读取第一个工作表sheet
data = []
for i in range(0, sheet.ncols): # ncols表示按列读取
data.append(list(sheet.col_values(i)))
return data
# xlrd为第三方包,可以通过用pip下载,具体操作:打开运行,输入cmd→在cmd中输入pip install xlrd,enter →等待安装完成即可。在后续若存在需要使用的第三方包,都可以通过这种方式下载和安装。
# 传入参数为path,path为excel所在路径。
# 传入的path需如下定义:path= r’ D:\excel.xlsx’或path= r’ D:\excel.xls’
# col_values(i)表示按照一列中的所有单元格遍历读取
# 可以根据需求,把col替换成row,则表示按行读取
# return data :返回的data是一个二维数组,根据col和row,传回的数据呈现形式也不同,即row是col的转置。
---------------------