Python中一些简单常用的处理文件方法

  • 改变文档的编码
import sys
reload(sys)
sys.setdefaultencoding('utf-8')

加上上面的三行之后就可以正常的显示或使用中文。


  • os.walk( top )

os.walk() 方法用于通过在目录树中游走输出在目录中的文件名,向上或者向下。

os.walk() 方法是一个简单易用的文件、目录遍历器,可以帮助我们高效的处理文件、目录方面的事情。

top – 是你所要遍历的目录的地址, 返回的是一个三元组(root,dirs,files)。

  • root 所指的是当前正在遍历的这个文件夹的本身的地址
  • dirs 是一个 list ,内容是该文件夹中所有的目录的名字(不包括子目录)
  • files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录)

  • os.path.splitext()

分离文件名与扩展名,返回结果是一个二元组 ('文件名','扩展名')

#!/usr/bin/python
#coding:utf-8

import re
import os
from bs4 import BeautifulSoup

import sys
reload(sys)
sys.setdefaultencoding('utf-8')

file=['a.http','b.txt','c.cc','d.dd.http',];

for f in file:
    a = os.path.splitext(f)
    print a
    print a[0]
    print a[1]
    print '###################'


for f in file:
    if os.path.splitext(f)[-1]=='.http':
        print f

这里写图片描述

猜你喜欢

转载自blog.csdn.net/xiaozuo666/article/details/81481913