day3—python——文件操作

文件的步骤:
1、有个文件
2、打开文件
3、操作文件 读、写
4、关闭

文件打开的三种模式:
r:只读模式,默认的,打开文件不存在的话,会报错
w:只写模式,会清空原来文件的内容,打开的文件不存在的话,会帮你新建一个文件
a:追加写模式,不能读,打开的文件不存在的话,也会帮你新建一个文件,a+能读能写

r+:读写模式,打开不存在的文件会报错
w+:写读模式,可读,但还是会把原来的文件清空
a+:追加读模式,打开的文件不存在的话,也会帮你新建一个文件

rb wb ab+:使用二进制的方式打开,比如打开图片、mp3等格式文件,即除了文本文件的其他格式文件;
B表示二进制,O表示八进制,D表示十进制,H表示十六进制

#file('a.txt','w') python2中的方法,python3里不用这个方法
--------------------------------------------------------------------------------

f = open('users.txt')
print(f.read())#获取到文件里面所有的内容,文件读到的都是字符串
f.close()
--------------------------------------------------------------------------------

f = open('users.txt')
print(f.read())
f.write('yangfan,12345\n') #只能写入字符串
f.close()
#会报错,文件不可写

--------------------------------------------------------------------------------

f = open('users.txt','w')
print(f.read())
f.write('yangfan,12345\n')
f.close()
#会报错,文件不可读
--------------------------------------------------------------------------------

f = open('users.txt','w')
f.write('yangfan,12345\n')
f.close()
#之前的内容丢失,只剩新加的内容
--------------------------------------------------------------------------------

f = open('users.txt','a+')
print(f.read())
f.write('yangfan,12345\n')
f.close()
#文件指针在最后,文件添加到最后,但是不可读,因为从文件指针往后读,后面并没有内容
--------------------------------------------------------------------------------

f = open('users.txt','a+')
f.seek(0)#移动文件指针
print(f.read())
f.write('yangfan,12345\n')
f.close()
#打印:
abc,123
bcd,456
#因为先读后写
--------------------------------------------------------------------------------

f = open('users.txt','a+')
f.seek(0)
print(f.read())
f.write('yangfan,12345\n')
f.flush() #刷新
f.close()
--------------------------------------------------------------------------------

f = open('users.txt',encoding='utf-8')
print(f.readlines()) #获取到文件里面所有的内容,但是返回的是list ,直接将每行进行分割
#打印:
['username,123456\n', 'username1,abc456\n', 'username2,111116\n']
f.close()

--------------------------------------------------------------------------------

print(f.readline())#读取一行,一行一行读取,读取下一行,要再输入一遍命令
--------------------------------------------------------------------------------

f = open('users.txt','a',encoding='utf-8')
a=['username1,12345\n','username2,123456\n']
f.writelines(a) #自动循环list添加
#等于for i in a:
# f.write(i+'\n')
--------------------------------------------------------------------------------

u='abc,123'
#字符串也可以循环,但是使用writelines浪费效率,因为字符串写入不需要循环,写入字符串只需要write就好
f.writelines(u)
--------------------------------------------------------------------------------

import requests
url='https://aliuwmp3.changba.com/userdata/video/35026AD35B136F789C33DC5901307461.mp4'
res=requests.get(url).content
f=open('changba.mp4','wb') #以二进制方式写入
f.write(res)

#爬虫,下载一首歌
--------------------------------------------------------------------------------

高效处理文件:
f为文件对象或文件句柄
第一种方式:
while True: #建一个死循环
line = f.readline() #一次只读取一行,避免大数据时占用内存
if line!='': #如果没有读到空数据,空行也可以打印,空行不代表空字符串
print('line:',line) #打印
else:
print('文件内容都读完了,结束了')
break

第二种方式:
for line in f:
print(line)
--------------------------------------------------------------------------------

监控日志:
说明:
#1、要从日志里面找到1分钟之内访问超过200次的
#2、每分钟都运行一次
思路:
# 1、读取文件内容,获取到ip地址
# 2、把每个ip地址存起来 {},用字典比list有效率
# 3、判断ip访问的次数是否超过200次
# 4、加入黑名单 print

import time
point = 0 #初始的位置
while True:
ips = {} #定义在循环内,每次执行后置空,方便下个60s的数据填入
f = open('access.log',encoding='utf-8') #打开文件
f.seek(point) #从记录的位置开始读
for line in f: #循环取文件里面每行数据
ip = line.split()[0] #按照空格分割,取第一个元素就是ip
if ip in ips:#判断这个ip是否存在
# ips[ip] = ips[ip]+1 同下行代码
ips[ip]+=1#如果存在的话,次数加+1
else:
ips[ip]=1 #如果不存在ip的次数就是1
point = f.tell() #记录文件指针位置
f.close()
for ip,count in ips.items():#循环这个字典,判断次数大于200的
if count>=200:
print('%s 加入黑名单'%ip)
time.sleep(60)
--------------------------------------------------------------------------------

使用绝对路径时,避免比如字符串中\n使用换行作用,不让转义,在路径前加r
f = open(r'C:\Users\nhy\Desktop\file.txt',encoding='utf-8')

修改小文件内容:
处理小文件的方法,以下方法占内存,一次性的读取文件到内存:

#1、简单、粗暴直接的
f = open(r'C:\Users\nhy\Desktop\file.txt',encoding='utf-8') #以读的方式打开一个文件
res = f.read().replace('一点','二点')#读取文件并将“一点”替换成“两点”,该行代码等同于res = f.read() res.replace
f.close()#关闭文件
f = open(r'C:\Users\nhy\Desktop\file.txt',mode='w',encoding='utf-8')#以写的方式再次打开文件,清空之前的内容,mode=可以删除,只留‘w’也可以
f.write(res)#写入替换的文件
f.flush() #立即把缓冲区里面的内容,写到磁盘上
f.close()

2.另一种
f = open('file.txt','a+',encoding='utf-8')
f.seek(0)
res = f.read().replace('你','NI')
f.seek(0)#再次将文件指针移到最前
f.truncate() #清空文件里面的内容
f.write(res)
f.close()
--------------------------------------------------------------------------------

修改大文件内容:
按行读写的方法:
import os #调用系统模块
f = open('file.txt',encoding='utf-8')
f2 = open('file.txt.bak','w',encoding='utf-8')
for line in f:
new_line = line.replace('一点','二点')
f2.write(new_line)#按行将f中的每一行写到f2中
f.close()
f2.close()
os.remove('file.txt')#删除f
os.rename('file.txt.bak','file.txt')#将f2重命名为f
--------------------------------------------------------------------------------

使用with判断用完文件后,会自动关闭文件:

import os #调用系统模块
with open('file.txt',encoding='utf-8') as f, open('file.txt.bak','w',encoding='utf-8') as f2:
#打开两个文件用逗号隔开
for line in f:
new_line = line.replace('二点','一点')
f2.write(new_line)
os.remove('file.txt')
os.rename('file.txt.bak','file.txt')

猜你喜欢

转载自www.cnblogs.com/apollecn/p/9613746.html