python基础查缺补漏

模块名=包名+模块名，
在这里插入图片描述

IO编程
1，由磁盘或者网络读入到内存里面的过程叫做读入 input ,由内存把数据发送到网络或者写入到磁盘的过程叫做出 output
2，流相当于水管，但是是单向的，浏览器和服务器如果想写入和写出，需要建立两条水管，即搭建两个流通道
3，在磁盘上读写数据的接口由操作系统提供的，操作系统不允许程序直接更改磁盘数据，程序需要向操作系统申请，操作系统来分配接口，才能操作磁盘上的数据。

f = open('/Users/michael/test.txt', 'r')        #这是向操作系统申请一个读文件的操作，通过python内置的open函数，如果找不到文件会抛异常

默认的open读的是utf-8编码的文件，如果不是utf-8编码的文件呢？open函数提供第三个参数，来指明读取文件时的编码

>>> f = open('/Users/michael/gbk.txt', 'r', encoding='gbk')
>>> f.read()

f.read()   #申请接口成功后，就可以读文件数据了，read()函数一次性把内容都读取了，如果文件很小，可以一次性读取，文件很大，不能一次性读取，而是设置一次读取的大小，然后循环读取，read(1024)，或者一行行的读取，readlines() 返回的是list列表，元素是每一行的数据

文件对象接口，由操作系统来分配的，会占用操作系统的资源，所以，用完这个接口，必须关闭

f.close()

每次调用操作文件接口，太繁琐，python提供了自动调用close()的方法，with

with open('/path/to/file', 'r') as f:
    print(f.read())

这样，就不用自己调用close()函数了
②写文件和读文件是一样的，唯一区别是调用open()函数时，传入标识符’w’或者’wb’表示写文本文件或写二进制文件：

>>> f = open('/Users/michael/test.txt', 'w')
>>> f.write('Hello, world!')
>>> f.close()

你可以反复调用write()来写入文件，但是务必要调用f.close()来关闭文件。当我们写文件时，操作系统往往不会立刻把数据写入磁盘，而是放到内存缓存起来，空闲的时候再慢慢写入。只有调用close()方法时，操作系统才保证把没有写入的数据全部写入磁盘。忘记调用close()的后果是数据可能只写了一部分到磁盘，剩下的丢失了。所以，还是用with语句来得保险：

with open('/Users/michael/test.txt', 'w') as f:
    f.write('Hello, world!')

要写入特定编码的文本文件，请给open()函数传入encoding参数，将字符串自动转换成指定编码。
细心的童鞋会发现，以’w’模式写入文件时，如果文件已存在，会直接覆盖（相当于删掉后新写入一个文件）。如果我们希望追加到文件末尾怎么办？可以传入’a’以追加（append）模式写入。

>>> f = open('/Users/michael/gbk.txt', 'w', encoding='gbk')  #以gbk编码形式写入文件

with open('/Users/michael/test.txt', 'a') as f:    #a的作用是不用覆盖文件里面已经有的，而是在后面继续写入
    f.write('Hello, world!')

StringIO和BytesIO

io模块中的类 from io import StringIO
内存中，开辟一个文本模式的buffer，可以像文件对象一样操作它
当close方法被调用的时候，这个buffer会被释放

>>> from io import StringIO
>>> sio = StringIO()  # 这是在内存中开辟一个空间，像文件对象一样操作
#下面是写入数据，返回值是写入了几个字符
>>> sio.write("hello,world!")
12
#是读取一行
>>> sio.readline()
'hello,world!'
>>> sio.getvalue()  # 无视指针，输出全部内容
'hello,world!'
>>> sio.close()

一般来说，磁盘的操作比内存的操作要慢得多，内存足够的情况下，一般的优化思路是少落地，减少磁盘IO的过程，可以大大提高程序的运行效率

1，得到一个文件夹内所有的文件和文件夹的名字，并且返回一个列表，使用os.listdir(文件夹的路径)
在这里插入图片描述

2，把两个路径合成一个时，不要直接拼字符串，而要通过os.path.join()函数，这样可以正确处理不同操作系统的路径分隔符。
在这里插入图片描述
上图其实就是路径字符串的拼接

上图其实是路径字符串的拆分

上图甚至还可以把一个路径字符串的扩展名拆分出来

注意：这些合并、拆分路径的函数并不要求目录和文件要真实存在，它们只对字符串进行操作。

上面是拼接的目录字符串，下面拿到拼接好的目录字符串，创建一个真正的目录了

# 然后创建一个目录:
>>> os.mkdir('/Users/michael/testdir')
# 删掉一个目录:
>>> os.rmdir('/Users/michael/testdir')

进程和线程

对于操作系统来说，一个任务就是一个进程（Process），比如打开一个浏览器就是启动一个浏览器进程，打开一个记事本就启动了一个记事本进程，打开两个记事本就启动了两个记事本进程，打开一个Word就启动了一个Word进程。

有些进程还不止同时干一件事，比如Word，它可以同时进行打字、拼写检查、打印等事情。在一个进程内部，要同时干多件事，就需要同时运行多个“子任务”，我们把进程内的这些“子任务”称为线程（Thread）。

在这里插入图片描述

在这里插入图片描述
创建进程以后，通过.start()方法启动进程，子进程不会影响下面主进程的执行

子进程和父进程互相一般不影响，有时主进程结束了，子进程还在执行。那么我们想等子进程结束以后，父进程才结束怎么办？可以让子进程对象调用join（）函数，这样主进程最后才结束，因为开发程序时候，主进程不做什么，都是开了多个子进程让他们工作，所有子进程结束以后，主进程结束，
在这里插入图片描述

1，各进程之间，不能共用全局变量；当子进程创建时候，会复制一个全局变量作为自己的变量，在自己的进程函数内改变变量的值，不会影响其他进程内变量的值（不同进程不能共享全局变量）

2，当我们创建很多个进程时候，不应该再用p = process(target=run)来一个个创建了，我们可以使用进程池，来创建多个进程，便于管理
首先引入进程池 from multiprocessing import pool
在这里插入图片描述
上图，循环创建的五个进程，都是执行的相同的run函数，如果想每个进程执行不同的函数，可以不用写循环的，

练习，复制一个文件夹下面所有文件到另一个文件夹下（一般写法）
在这里插入图片描述

而多进程的写法如下图
在这里插入图片描述

线程
一个进程至少有一个线程，线程没有自己的独立空间，所有线程之间，共享一个变量，而进程有自己的独立空间，各进程之间不共享变量（只要启动一个进程，就会默认启动一个线程）

网络编程

TCP/ip协议
ip协议就是每一台电脑都有唯一的ip, 路由器把IP包给转发出去，IP包按一块块的发送，途径哪个路线哪个路由器不一定，不能保证到达，也不能保证按顺序到达
TCP协议，就是给每一个ip包编号，让他们按顺序到达，如果丢失了某个IP包，会自动重新发送

端口
在两台计算机通信时，只发IP地址是不够的，因为同一台计算机上跑着多个网络程序。一个TCP报文来了之后，到底是交给浏览器还是QQ，就需要端口号来区分。每个网络程序都向操作系统申请唯一的端口号，这样，两个进程在两台计算机之间建立网络连接就需要各自的IP地址和各自的端口号

python基础查缺补漏

猜你喜欢