一、线程

1、并发和并行

并发：指的是任务数多余cpu核数，通过操作系统的各种任务调度算法，实现用多个任务“一起”执行（实际上总有一些任务不在执行，因为切换任务的速度相当快，看上去一起执行而已）

并行：指的是任务数小于等于cpu核数，即任务真的是一起执行的

2、线程

python的thread模块是比较底层的模块，python的threading模块是对thread做了一些包装的，可以更加方便的被使用

3、简单的多线程demo

import threading
import time


def test1():
    for i in range(5):
        print("-------线程1--------")
        time.sleep(1)


def test2():
    for i in range(5):
        print("---------线程2---------")
        time.sleep(1)


def main():
    # 使用threading模块的Thread方法，在主线程上创建一个子线程，并返回
    # target ： 子线程要执行的方法名称
    t1 = threading.Thread(target = test1)
    t1.start()
    t2 = threading.Thread(target = test2)
    t2.start()


if __name__ == "__main__":
    main()

4、查看正在运行的线程

import threading
import time


def test1():
    for i in range(5):
        time.sleep(1)


def test2():
    for i in range(10):
        time.sleep(1)


def main():
    # 创建子线程
    """
        使用Thread方法创建子线程对象的时候，并不会创建线程
        当子线程对象调用start()方法的时候，才开始创建子线程，并且线程开始运行
    """
    t1 = threading.Thread(target = test1)
    t1.start()
    t2 = threading.Thread(target = test2)
    t2.start()
    
    """
        threading.enumerate()方法可以查看当前运行的线程
            返回值是一个列表
            列表中放的是主线程和每一个子线程的信息
            如果主线程挂了，子线程立即结束运行
            子线程运行结束，不会影响主线程的运行
    """
    print(type(threading.enumerate()))
    # 结果：<class 'list'>
    print(threading.enumerate())
    # 结果：[<_MainThread(MainThread, started 140470619174656)>, <Thread(Thread-1, started 140470593447680)>, <Thread(Thread-2, started 140470585054976)>]


if __name__ == "__main__":
    main()

5、创建线程的第二种方法：继承Thread类

import time


class MyThread(threading.Thread):
    # 重写run方法，run方法中是该线程要执行的动作
    def run(self):
        for i in range(5):
            time.sleep(1)
            msg = self.name
            print(msg) # 线程名称


def main():
    # 创建自定义的线程类对象
    t = MyThread()
    # 调用自定义线程类中的继承自父类的start方法，执行自定义线程类中的run方法
    t.start()


if __name__ == "__main__":
    main()

6、多线程共享全局变量

import threading
import time


def test1(temp):
    temp.append(33)
    print("----------test1的全局变量值：%s-------" % str(temp))


def test2(temp):
    print("----------test2的全局变量值：%s-------" % str(temp))


list1 = [11, 22]


def main():
    # target指定线程要执行的代码的函数
    # args 指定调用函数的时候，要传递的参数列表，类型是一个元组
    t1 = threading.Thread(target = test1, args = (list1, ))
    t2 = threading.Thread(target = test2, args = (list1, ))

    t1.start()
    # 此处让进程休眠1秒钟是为了让线程1先执行完成，让全局变量修改完毕在进行操作
    time.sleep(1)

    t2.start()
    time.sleep(1)

    # 打印最终的全局变量
    print("-------------最终的变量为：%s-----------" % str(list1))

if __name__ == "__main__":
    main()

7、多线程共享全局变量的问题 -- 资源竞争

import threading
import time


# 定义一个全局变量
glo_num = 0


def test1(num):
    global glo_num
    for i in range(num):
        glo_num += 1
    print("------test1中的num是：%s--------" % str(glo_num))


def test2(num):
    global glo_num
    for i in range(num):
        glo_num += 1
    print("------test2中的num是：%d--------" % glo_num)


def main():
    t1 = threading.Thread(target = test1, args = (1000000,))
    t2 = threading.Thread(target = test2, args = (1000000, ))
    t1.start()
    t2.start()
    time.sleep(10)
    print("------两个线程执行完毕之后的全局变量为：%d" % glo_num)
    """
        以上程序打印结果是：
            ------test1中的num是：1358112--------
            ------test2中的num是：1407249--------
            ------两个线程执行完毕之后的全局变量为：1407249

        发现问题：两个循环各循环1000000次，所以最终结果应该是2000000
                 但是由于线程之间存在相互抢占资源的问题，则会导致第一个
                 方法没有执行完毕，已经失去了线程的使用权，第二个方法开始
                 使用了全局变量，等到第一个方法获取线程cpu使用权的时候，
                 第二个方法已经对全局变量进行了修改，而此时线程1和线程2
                 使用的全局变量的值已经不相同了，因此造成数值的错误。
            即：多个线程之间会抢占资源⭐⭐⭐
    """


if __name__ == "__main__":
    main()

8、同步

同步就是协同步调，按预定的先后次序进行运行。如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行;B执行，再将结果给A；A再继续操作。

当多个线程几乎同时修改某一个共享数据的时候，需要进行同步控制。线程同步能够保证多个线程安全访问竞争资源，最简单的同步机制是引入互斥锁。

9、互斥锁

互斥锁为资源引入一个状态：锁定/非锁定。

某个线程要更改共享数据时，先将其锁定，此时资源的状态为“锁定”，其他线程不能更改；直到该线程释放资源，将资源的状态变成“非锁定”，其他的线程才能再次锁定该资源。互斥锁保证了每次只有一个线程进行写入操作，从而保证了多线程情况下数据的正确性。

threading的模块中定义了Lock类，用于处理锁：

# 创建锁,返回的是一个锁的对象
myLock = threading.Lock()

# 锁定当前线程，如果锁定之前，线程没有上锁，acquire()操作不会阻塞
# 如果在acquire()操作之前，它已经被其他线程上了锁，那么此时调用acquire()方法会阻塞，直到其他线程释放锁之后才会执行
myLock.acquire()

# 释放当前线程
myLock.release()

使用互斥锁解决7中资源竞争的问题

import threading
import time


# 定义全局变量
glo_num = 0


def test1(num):
    global glo_num
    for i in range(num):
        # 上锁
        myLock.acquire()
        glo_num += 1
        # 解锁
        myLock.release()
    print("---------test1程序运行结束之后全局变量的结果是：%d---------" % glo_num)


def test2(num):
    global glo_num
    for i in range(num):
        # 上锁
        myLock.acquire()
        glo_num += 1
        # 解锁
        myLock.release()
    print("---------test2程序运行结束之后全局变量的结果是：%d---------" % glo_num)


# 创建一个互斥锁，默认是没有上锁状态
myLock = threading.Lock()


def main():
    t1 = threading.Thread(target = test1, args = (1000000, ))
    t2 = threading.Thread(target = test2, args = (1000000, ))

    t1.start()
    t2.start()

    # 让系统休眠5s，等待两个线程执行完毕
    time.sleep(5)
    print("-----------两个线程执行完毕之后，全局变量的值为：%d-------------" % glo_num)
    """
        运行结果：
            ---------test1程序运行结束之后全局变量的结果是：1988686---------
            ---------test2程序运行结束之后全局变量的结果是：2000000---------
            -----------两个线程执行完毕之后，全局变量的值为：2000000-------------
    """


if __name__ == "__main__":
    main()

锁的好处：

确保了某段关键代码只能由一个线程从头到尾完整地执行。

锁的坏处：

阻止了多线程并发执行，包含锁的某段代码实际上只能以单线程模式执行，效率就大大地下降了。

由于可以存在多个锁，不同的线程持有不同的锁，并试图获取对方持有的锁时，可能会造成死锁。

10、死锁

死锁产生的原因：

在线程间共享多个资源的时候，如果两个线程分别占有一部分资源并且同时等待对方的资源，就会造成死锁。

死锁的demo：

import threading
import time


# 自定义的线程类，继承了threading.Thread类
class MyThreadA(threading.Thread):
    def run(self):
        # 对锁A进行上锁操作
        lockA.acquire()

        print("-----------A类中对%s进行上锁操作-----------" % self.name)

        # 让系统休眠2s
        time.sleep(2)

        # 对锁B进行上锁
        lockB.acquire()

        print("-----------A类中对%s进行上锁操作-----------" % self.name)

        # 释放B锁
        lockB.release()

        # 释放A锁
        lockA.release()



# 自定义线程类
class MyThreadB(threading.Thread):
    def run(self):
        # 对锁B进行上锁操作
        lockB.acquire()

        print("-----------B类中对%s进行上锁操作-----------" % self.name)

        # 让系统休眠2s
        time.sleep(2)

        # 对锁A进行上锁
        lockA.acquire()

        print("-----------B类中对%s进行上锁操作-----------" % self.name)

        # 释放A锁
        lockA.release()

        # 释放B锁
        lockB.release()



# 创建两个自定义锁对象
lockA = threading.Lock()
lockB = threading.Lock()


def main():
    t1 = MyThreadA()
    t2 = MyThreadB()

    t1.start()
    t2.start()

    """
        程序运行打印两句话之后，变成死锁
    """


if __name__ == "__main__":
    main()

11、使用多任务实现udp的聊天器

import threading
import socket


# 发送信息
def send_msg(udp_socket, dest_ip, dest_port):
    """发送数据"""
    while True:
        content = input("请输入内容：")

        udp_socket.sendto(content.encode("utf-8"), (dest_ip, dest_port))


# 接收数据
def recv_msg(udp_socket):
    """接收数据"""
    while True:
       recv_data = udp_socket.recvfrom(1024)
       print(recv_data[0].decode("utf-8"))


def main():
    # 1.创建套接字对象
    udp_socket = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)

    # 2.绑定端口号
    udp_socket.bind(("", 8888))

    # 3.获取目的方的ip和端口号
    ip = input("请输入对方的ip：")
    port = int(input("请输入对方的port："))

    # 4.使用多线程同时进行收发操作
    sendMsg = threading.Thread(target = send_msg, args = (udp_socket, ip, port))
    recvMsg = threading.Thread(target = recv_msg, args = (udp_socket, ))

    sendMsg.start()
    recvMsg.start()


if __name__ == "__main__":
    main()

二、进程

1、进程

一个程序运行起来后，代码+用到的资源称之为进程，它是操作系统分配资源的基本单元。不仅可以通过线程完成多任务，进程也是可以的。

2、进程的状态

就绪态：运行的条件都已经慢去，正在等在cpu执行

执行态：cpu正在执行其功能

等待态：等待某些条件满足，例如一个程序sleep了，此时就处于等待态

3、创建进程

import multiprocessing
import time


def test1():
    while True:
        print("-----1----")
        time.sleep(1)


def test2():
    while True:
        print("-----2----")
        time.sleep(1)


def main():
    # 创建进程
    """
		Process([group [, target [, name [, args [, kwargs]]]]])

		    target：如果传递了函数的引用，可以任务这个子进程就执行这里的代码
		    args：给target指定的函数传递的参数，以元组的方式传递
		    kwargs：给target指定的函数传递命名参数
		    name：给进程设定一个名字，可以不设定
		    group：指定进程组，大多数情况下用不到
		    Process创建的实例对象的常用方法：

		    start()：启动子进程实例（创建子进程）
		    is_alive()：判断进程子进程是否还在活着
		    join([timeout])：是否等待子进程执行结束，或等待多少秒
		    terminate()：不管任务是否完成，立即终止子进程
		    Process创建的实例对象的常用属性：

		    name：当前进程的别名，默认为Process-N，N为从1开始递增的整数
		    pid：当前进程的pid（进程号）
    """
    p1 = multiprocessing.Process(target = test1)
    p2 = multiprocessing.Process(target = test2)
    
    p1.start()
    p2.start()



if __name__ == "__main__":
    main()

4、获取pid、ppid

import multiprocessing
import time
import os


def test1():
    while True:
        print("--------子进程的pid为：%d， 父进程ppid为：%d-------" % (os.getpid(), os.getppid()))
        time.sleep(1)


def main():
    print("--------主进程的pid为：%d， 父进程ppid为：%d-------" % (os.getpid(), os.getppid()))
    p = multiprocessing.Process(target = test1)
    p.start()


if __name__ == "__main__":
    main()

注意：进程中，如果父进程终止，子进程并不会终止（进程之间时独立的）

5、子进程中传递参数

import multiprocessing


def test1(a, b, *args, **kwargs):
    print(a)
    print(b)
    print(args)
    print(kwargs)
    """
		打印结果：
				11
				22
				(33, 44, 55)
				{'mm': '66'}
    """



def main():
    p = multiprocessing.Process(target = test1, args = (11,22,33,44,55), kwargs = {"mm":"66"})
    p.start()


if __name__ == "__main__":
    main()

6、多进程之间共享全局变量

import multiprocessing
import time


# 定义全局变量
glo_list = [11, 22, 33]


def test1():
    glo_list.append(44)
    print("-------test1中的全局变量为：%s--------" % str(glo_list))


def test2():
    time.sleep(1)
    print("-------test2中的全局变量为：%s--------" % str(glo_list))


def main():
    p1 = multiprocessing.Process(target = test1)
    p1.start()
    
    p2 = multiprocessing.Process(target = test2)
    p2.start()

    """
		打印结果：
			-------test1中的全局变量为：[11, 22, 33, 44]--------
            -------test2中的全局变量为：[11, 22, 33]--------
    """


if __name__ == "__main__":
    main()

结论：多个进程之间不共享全局变量，即在一个进程中对全局变量修改过后，不会影响另一个进程中的全局变量，因为：多个进程之间时相互独立的。

7、线程和进程之间的比较

（1）、功能

进程，能够完成多任务，比如在一台电脑上能够同时运行多个QQ

线程，能够完成多任务，比如一个QQ中的多个聊天窗口

（2）、定义的不同

进程是系统进行资源分配和调度的一个独立单位.

线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位.线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈),但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源。

（3）、区别

一个程序至少有一个进程,一个进程至少有一个线程.

线程的划分尺度小于进程(资源比进程少)，使得多线程程序的并发性高。

进程在执行过程中拥有独立的内存单元，而多个线程共享内存，从而极大地提高了程序的运行效率

线线程不能够独立执行，必须依存在进程中

可以将进程理解为工厂中的一条流水线，而其中的线程就是这个流水线上的工人

（4）、优缺点

线程和进程在使用上各有优缺点：线程执行开销小，但不利于资源的管理和保护；而进程正相反。

8、多进程之间通信 -- Queue

可以使用multiprocessing模块的Queue实现多进程之间的数据传递，Queue本身是一个消息列队程序

Queue使用Demo

import multiprocessing
import time


def download(q):
    """模拟下载数据的功能"""
    data = [11, 22, 33, 44]
    
    # 向队列中写入数据
    for temp in data:
        q.put(temp)
    
    print("----下载器已经下载完毕数据，并将数据存入到队列中----")


def analysis(q):
    """数据处理"""
    analysis_data = list()
    time.sleep(1)
    
    # 从队列中获取数据
    while True:
        data = q.get()
        analysis_data.append(data)
        
        if q.empty():
            break
    
    # 对数据进行处理
    print(str(analysis_data))


def main():
    # 1.创建一个队列
    q = multiprocessing.Queue()
    
    # 2.创建多个线程，将队列对象作为参数传递到子线程中
    p1 = multiprocessing.Process(target = download, args = (q, ))
    p2 = multiprocessing.Process(target = analysis, args = (q, ))
    
    p1.start()
    p2.start()

    """
		运行结果：
				----下载器已经下载完毕数据，并将数据存入到队列中----
				[11, 22, 33, 44]
    """


if __name__ == "__main__":
    main()

队列Queue中API使用说明：

初始化Queue()对象时（例如：q=Queue()），若括号中没有指定最大可接收的消息数量，或数量为负值，那么就代表可接受的消息数量没有上限（直到内存的尽头）；

Queue.qsize()：返回当前队列包含的消息数量；

Queue.empty()：如果队列为空，返回True，反之False ；

Queue.full()：如果队列满了，返回True,反之False；

Queue.get([block[, timeout]])：获取队列中的一条消息，然后将其从列队中移除，block默认值为True；

1）如果block使用默认值，且没有设置timeout（单位秒），消息列队如果为空，此时程序将被阻塞（停在读取状态），直到从消息列队读到消息为止，如果设置了timeout，则会等待timeout秒，若还没读取到任何消息，则抛出"Queue.Empty"异常

2）如果block值为False，消息列队如果为空，则会立刻抛出"Queue.Empty"异常；

Queue.get_nowait()：相当Queue.get(False)；

Queue.put(item,[block[, timeout]])：将item消息写入队列，block默认值为True；

1）如果block使用默认值，且没有设置timeout（单位秒），消息列队如果已经没有空间可写入，此时程序将被阻塞（停在写入状态），直到从消息列队腾出空间为止，如果设置了timeout，则会等待timeout秒，若还没空间，则抛出"Queue.Full"异常；

2）如果block值为False，消息列队如果没有空间可写入，则会立刻抛出"Queue.Full"异常；

Queue.put_nowait(item)：相当Queue.put(item, False)；

9、进程池Pool

from multiprocessing import Pool
import os, time, random


def worker(msg):
    t_start = time.time()
    print("%s开始执行,进程号为%d" % (msg,os.getpid()))
    # random.random()随机生成0~1之间的浮点数
    time.sleep(random.random()*2) 
    t_stop = time.time()
    print(msg,"执行完毕，耗时%0.2f" % (t_stop-t_start))


po = Pool(3)  # 定义一个进程池，最大进程数3

for i in range(0,10):
    # Pool().apply_async(要调用的目标,(传递给目标的参数元祖,))
    # 每次循环将会用空闲出来的子进程去调用目标
    po.apply_async(worker,(i,))


print("----start----")
po.close()  # 关闭进程池，关闭后po不再接收新的请求
po.join()  # 等待po进程池中所有子进程执行完成，必须放在close语句之后
print("-----end-----")

"""
	运行结果：
		----start----
		0开始执行,进程号为21466
		1开始执行,进程号为21468
		2开始执行,进程号为21467
		0 执行完毕，耗时1.01
		3开始执行,进程号为21466
		2 执行完毕，耗时1.24
		4开始执行,进程号为21467
		3 执行完毕，耗时0.56
		5开始执行,进程号为21466
		1 执行完毕，耗时1.68
		6开始执行,进程号为21468
		4 执行完毕，耗时0.67
		7开始执行,进程号为21467
		5 执行完毕，耗时0.83
		8开始执行,进程号为21466
		6 执行完毕，耗时0.75
		9开始执行,进程号为21468
		7 执行完毕，耗时1.03
		8 执行完毕，耗时1.05
		9 执行完毕，耗时1.69
		-----end-----
"""

multiprocessing.Pool常用函数解析：

apply_async(func[, args[, kwds]])：使用非阻塞方式调用func（并行执行，堵塞方式必须等待上一个进程退出才能执行下一个进程），args为传递给func的参数列表，kwds为传递给func的关键字参数列表；

close()：关闭Pool，使其不再接受新的任务；

terminate()：不管任务是否完成，立即终止；

join()：主进程阻塞，等待子进程的退出，必须在close或terminate之后使用；

进程池中使用Queue：

如果要使用Pool创建进程，就需要使用multiprocessing.Manager()中的Queue()，而不是multiprocessing.Queue()，否则会得到一条如下的错误信息：RuntimeError: Queue objects should only be shared between processes through inheritance.

10、案例：文件夹copy器（多进程版）

import os
import multiprocessing

def copy_file(q, file_name, src_folder_name, des_folder_name):
    """完成文件复制的方法"""
    print("======== 文件copy方法：从 %s ---->  到 %s , 文件名是：%s " % (src_folder_name, des_folder_name, file_name))

    # 打开源文件
    src_file = open(src_folder_name + "/" + file_name, "rb")
    content = src_file.read()
    src_file.close()

    des_file = open(des_folder_name + "/" + file_name, "wb")
    des_file.write(content)
    des_file.close()

    # 完成文件拷贝，向队列中写入一个消息，表示已经完成
    q.put(file_name)


def main():
    # 1.获取用户要拷贝的文件夹
    src_folder_name = input("请输入要拷贝的文件夹的名字：")

    # 2.创建一个新的文件夹
    try:
        des_folder_name = "[copy]" + src_folder_name
        os.mkdir(des_folder_name)
    except:
        # 如果创建文件报错，为了保证程序可以正常执行，使用try...except...包裹起来
        pass

    # 3.获取源文件夹下所有要copy的文件的名字，使用 listdir() 方法，返回一个列表
    file_names = os.listdir(src_folder_name)
    # print(file_names)

    # 4.创建进程池，最大任务数为5
    po = multiprocessing.Pool(5)

    # 5.创建一个队列
    q = multiprocessing.Manager().Queue()

    # 6.向进程池中添加copy文件的任务
    for file_name in file_names:
        po.apply_async(copy_file, args = (q, file_name, src_folder_name, des_folder_name))

    # 关闭进程池
    po.close()
    # po.join 等待进程池中所有任务执行完毕，结束进程
    # po.join

    """
        此处不实用po.join方法是因为要显示进度条，需要写一个无限循环，自己控制循环结束的时机
    """
    # 获取总文件数
    all_file_num = len(file_names)

    # 定义已经完成copy的文件数
    copy_ok_num = 0

    while True:
        # 从队列中获取完成的文件名
        file_name = q.get()
        copy_ok_num += 1

        # 打印进度
        print("\r拷贝的进度为：%.2f %%" % (copy_ok_num * 100/ all_file_num), end = "")

        # 设置循环结束的条件
        if copy_ok_num >= all_file_num:
            break

    print()


if __name__ == "__main__":
    main()

三、协程

1、迭代器

（1）、自定义对象实现迭代器功能

from collections import Iterable
from collections import Iterator
import time


# 自定义类，实现迭代功能
class ClassMate(object):
    
    # 构造方法
    def __init__(self):
        self.names = list()
        self.current_num = 0
    
    # 定义普通方法
    def add(self, name):
        self.names.append(name)
    
    """
        如果想让一个自定义的对象成为一个可以迭代的对象，
        即：可以使用[ for temp in 自定义类对象]，
        那么必须实现 __iter__ 方法，并且返回一个具有 __iter__ 和 __next__ 方法的引用
    """ 
    def __iter__(self):
        # 返回一个迭代器的对象，并将自身的引用当作参数传递
        return self
    
    # 遍历的时候调用 next 方法会使用该方法
    def __next__(self):
        
        # 判断自定义的索引值是否小于names列表长度
        if self.current_num < len(self.names):
            value = self.names[self.current_num]
            # 每次获取一个元素之后，索引+1
            self.current_num += 1
            return value
        # 如果if条件不成立，即列表中元素都取完，为了不让next方法返回None，在else中抛出一个异常
        else:
            raise StopIteration  # 抛出该异常后，for循环会结束

c = ClassMate()
c.add("zhangsan")
c.add("lisi")
c.add("wangwu")

"""
    自定义的类中如果有 __iter__ 方法，则，实例化之后的类对象就会变成一个可以迭代的对象
    print("判断c是否是可以迭代的对象：", isinstance(c, Iterable))     # True

    使用 iter() 方法将自定义类对象当作参数传递，就相当于调用自定义类中的 __iter__ 方法
    返回的是一个迭代器对象，即：我们上面定义的 ClassIterator 类对象
    classmate_iterator = iter(c)

    然后调用 next() 方法，将迭代器对象当作参数传递，就可以获取迭代器中的 __next__ 方法的返回值
    print("判断classmate_iterator是否是迭代器对象：", isinstance(classmate_iterator, Iterator)) # True


"""
for name in c:
    print(name)

（2）、使用迭代器实现斐波那契数列的算法

# 定义斐波那契类
class Fibonacci(object):
    # max_num 生成的斐波那契数的个数
    def __init__(self, max_num):
        self.current_num = 0
        self.max_num = max_num
        self.a = 0
        self.b = 1

    def __iter__(self):
        return self

    def __next__(self):
        if self.current_num < self.max_num:

            result = self.a

            self.a, self.b = self.b, self.a + self.b

            self.current_num += 1
            return result
        else:
            raise StopIteration

f = Fibonacci(15)

for i in f:
    print(i)

2、生成器

（1）、什么是生成器

利用迭代器，我们可以在每次迭代获取数据（通过next()方法）时按照特定的规律进行生成。但是我们在实现一个迭代器时，关于当前迭代到的状态需要我们自己记录，进而才能根据当前状态生成下一个数据。为了达到记录当前状态，并配合next()函数进行迭代使用，我们可以采用更简便的语法，即生成器(generator)。生成器是一类特殊的迭代器。

（2）、创建生成器的方法

1）、把列表生成式的 [ ] 改为 ( ) 即可

"""
    列表生成式
"""
list1 = [i * 2 for i in range(20) if i % 2 == 0]
print(list1)    # [0, 4, 8, 12, 16, 20, 24, 28, 32, 36]


"""
    列表生成式转换为列表生成器
"""
list2 = (i * 2 for i in range(15) if i % 2 == 1)
print(list2)    # <generator object <genexpr> at 0x7f0103a54eb8>
# 生成器只是一个生成的方式，不是具体的列表，所以直接打印没有任何的数据

for i in list2:
    print(i, end="\t") # 2       6       10      14      18      22      26

2）、创建生成器的方法二

def gen_num(num_nums):

    a, b = 0, 1

    current_num = 0

    while current_num < num_nums:

        """
            如果一个函数中出现了 yield 关键字，
            那么这个函数就不会被当作函数进行调用，
            而是变成了一个生成器的模版
        """
        yield a

        a, b = b, a+b

        current_num += 1


"""
    如果在调用函数的时候，发现函数中有yield关键字，则语句就不是调用函数，
    而是创建一个生成器对象
"""
obj = gen_num(20)
print(obj)  # <generator object gen_num at 0x7f73ae9ea200>

for i in obj:
    print(i, end="  ")  # 0  1  1  2  3  5  8  13  21  34  55  89  144  233  377  610  987  1597  2584  4181

（3）、生成器的next用法

def gen_num(num_nums):

    current_num = 0

    a, b = 0, 1

    while current_num < num_nums:

        yield a

        a, b = b, a+b

        current_num += 1

    return "end..."

"""
    使用 next(生成器对象) 方法的时候，每一次的返回值都是 yield 关键字返回的数据
    如果生成器中有 return 关键字，通过生成器对象接收不到
    如果想要获取return的值，需要在异常中获取
"""

g = gen_num(10)

while True:
    try:
        rest = next(g)
        print(rest, end = " ")  # 0 1 1 2 3 5 8 13 21 34
    except Exception as e:
        retu = e.value  # 生成器的next方法产生异常的时候，异常对象的 value 属性就是生成器中的return的值
        print(retu)     # end...
        break

（4）、生成器对象使用send方法

def gen_num(num_nums):

    current_num = 0

    a, b = 0, 1

    while current_num < num_nums:

        arg = yield a
        print("----> 此处是生成器对象调用send方法的时候，传递的参数，被arg接收:", arg)

        a, b = b, a+b

        current_num += 1


# 创建生成器对象
g = gen_num(10)

# 调用 next 方法
rest1 = next(g)     # 调用next方法，返回值是生成器中 yield 后面的变量
print(rest1)        # 0

"""
    调用生成器的 send 方法
    返回值也是生成器中的 yield 后面的变量
    但是 send 方法可以传递参数，参数会传递给生成器中 yield 前面的变量
    注意：一般如果传递一个具体的值的时候，send方法不能用在第一次调用生成器的时候
          一般会配合这next方法使用
"""
rest2 = g.send("aaa")
print(rest2)        # 1

"""
    程序最终运行结果：
        0
        ----> 此处是生成器对象调用send方法的时候，传递的参数，被arg接收: aaa
        1

3、使用yield完成多任务

import time

def test1():
    while True:
        print("-------1-------")
        yield
        time.sleep(0.1)


 def test2():
     while True:
         print("-------2-------")
         yield
         time.sleep(0.1)
 
 
 def main():
 
     while True:
         
         t1 = test1()
         t2 = test2()
         next(t1)
         next(t2)
 
 
 if __name__ == "__main__":
     main()
     
""""
     运行结果:
	     -------1-------
	     -------2-------
	     -------1-------
	     -------2-------
	     -------1-------
	     -------2-------
	     -------1-------
	     -------2-------
	     -------1-------
""""

4、使用greenlet实现多线程

python中的greenlet模块对多任务进行封装，其实是对yield进行简单的处理，从而使得切换任务变的更加简单。使用greenlet首先要安装greenlet的插件：

sudo pip3 install greenlet

使用greenlet的demo

import time
from greenlet import greenlet


def test1():
    while True:
        print("------A------")
        # 切换到test2中运行
        t2.switch()
        time.sleep(0.5)
        

def test2():
    while True:
        print("------B------")
        # 切换到test1中运行
        t1.switch()
        time.sleep(0.5)

t1 = greenlet(test1)
t2 = greenlet(test2)

5、使用gevent实现多线程

导入gevent模块

sudo pip3 install gevent

使用gevent实现多线程的Demo

# 将程序中用到的耗时操作的代码，换为gevent中自己实现的模块
monkey.patch_all()


def f1(n):
    for i in range(n):
        print(gevent.getcurrent(), i)
        time.sleep(0.5)


def f2(n):
    for i in range(n):
        print(gevent.getcurrent(), i)
        time.sleep(0.5)


def f3(n):
    for i in range(n):
        print(gevent.getcurrent(), i)
        time.sleep(0.5)


print("------1-----")
g1 = gevent.spawn(f1, 5)
print("------2-----")
g2 = gevent.spawn(f2, 5)
print("------3-----")
g3 = gevent.spawn(f3, 5)
g1.join()
g2.join()
g3.join()
"""
    运行结果：
        ------1-----
        ------2-----
        ------3-----
        <Greenlet at 0x7fcc7a55dcc0: f1(5)> 0
        <Greenlet at 0x7fcc7a55de88: f2(5)> 0
        <Greenlet at 0x7fcc7a55df20: f3(5)> 0
        <Greenlet at 0x7fcc7a55dcc0: f1(5)> 1
        <Greenlet at 0x7fcc7a55de88: f2(5)> 1
        <Greenlet at 0x7fcc7a55df20: f3(5)> 1
        <Greenlet at 0x7fcc7a55dcc0: f1(5)> 2
        <Greenlet at 0x7fcc7a55de88: f2(5)> 2
        <Greenlet at 0x7fcc7a55df20: f3(5)> 2
        <Greenlet at 0x7fcc7a55dcc0: f1(5)> 3
        <Greenlet at 0x7fcc7a55de88: f2(5)> 3
        <Greenlet at 0x7fcc7a55df20: f3(5)> 3
        <Greenlet at 0x7fcc7a55dcc0: f1(5)> 4
        <Greenlet at 0x7fcc7a55de88: f2(5)> 4
        <Greenlet at 0x7fcc7a55df20: f3(5)> 4
"""

"""
    如果join操作比较多，可以用一下写法：

"""
gevent.joinall([
    
    gevent.spawn(f1, 5)
    gevent.spawn(f2, 5)
    gevent.spawn(f3, 5)

6、案例：使用gevent实现图片下载

import gevent
from gevent import monkey
import urllib.request


# 打延时补丁
monkey.patch_all()


# 定义下载的方法
def download(img_url, img_name):

    req = urllib.request.urlopen(img_url)

    img_content = req.read()

    with open(img_name, "wb") as f:
        f.write(img_content)


def main():
    gevent.joinall([
        gevent.spawn(download, "https://rpic.douyucdn.cn/live-cover/appCovers/2018/01/30/4230431_20180130233438_big.jpg", "girl1.jpg"),
        gevent.spawn(download, "https://rpic.douyucdn.cn/live-cover/appCovers/2018/02/01/3774794_20180201155048_big.jpg", "girl2.jpg")
    ])


if __name__ == "__main__":
    main()

7、线程、进程、协程总结

进程是资源分配的单位

线程是操作系统调度的单位

进程切换需要的资源很最大，效率很低

线程切换需要的资源一般，效率一般（当然了在不考虑GIL的情况下）

协程切换任务资源很小，效率高

多进程、多线程根据cpu核数不一样可能是并行的，但是协程是在一个线程中所以是并发

Python高级 -- 03 多任务（线程、进程、协程）