python 多线程多队列 - 代码天地

python 多线程多队列

其他 2018-10-20 04:05:54 阅读次数: 0

我们常常目标具有多任务，所以我们才多队列，但是为了提高速度，常常采用多线程，所以多线程多队列

#coding=utf-8
import Queue
import threading
import urllib2
import time
from BeautifulSoup import BeautifulSoup

hosts = ["http://yahoo.com", "http://taobao.com", "https://baidu.com",]

queue = Queue.Queue()  # 存放网址的队列
out_queue = Queue.Queue()  # 存放网址页面的队列

class MyThread(threading.Thread):
    def __init__(self, func):
        threading.Thread.__init__(self)
        self.func = func
    def run(self):
        self.func()

def do_work():
    while True:#不要使用 while not out_queue.empty():
        host=queue.get()
        url = urllib2.urlopen(host)
        chunk = url.read()
        out_queue.put(chunk)  # 将hosts中的页面传给out_queue
        queue.task_done()  # 传入一个相当于完成一个任务

def do_work2():
    while True: #不要使用 while not out_queue.empty():
        chunk =out_queue.get()
        soup = BeautifulSoup(chunk)  # 从源代码中搜索title标签的内容
        print soup.findAll(['title'])
        out_queue.task_done()



start = time.time()


def main():
    for i in range(5):
        t = MyThread(do_work)  # 线程任务就是将网址的源代码存放到out_queue队列中
        t.setDaemon(True)  # 设置为守护线程
        t.start()
    print "out_queue: %d"%out_queue.qsize()
        # 将网址都存放到queue队列中
    for host in hosts:
        queue.put(host)
    print "queue: %d" % queue.qsize()
    for i in range(5):
        dt = MyThread(do_work2)  # 线程任务就是从源代码中解析出<title>标签内的内容
        dt.setDaemon(True)
        dt.start()

    queue.join()  # 线程依次执行，主线程最后执行
    out_queue.join()


main()
print "Total time :%s" % (time.time() - start)

猜你喜欢

转载自blog.csdn.net/DAo_1990/article/details/68495207

python 多线程多队列

多线程多队列（python）

python 多线程队列

python 多线程与队列

Python多线程与队列

Python中的多线程与队列

python 多线程处理队列

python 多线程队列套接字

Python队列与多线程及文件锁

Python的多线程锁跟队列

Python多线程和队列结合demo

【python】threading多线程学习队列（二）

Python多线程（3）--queue队列

Python 多线程与队列运用实例

Python3多线程、队列

玩转python（7）python多协程，多线程的比较

python中多线程（threading、队列、event、paramiko）

python 归纳 (十三)_队列Queue在多线程中使用

python 归纳 (十八)_队列Queue在多线程中使用(二)

PYTHON——多线程：队列Queue数据结构

python_day29_通过类创建多线程_队列

Python 爬虫，多线程爬虫，任务队列Queue

tensorflow常用图像处理代码，多线程，队列等python代码

python网络编程：Queue的使用、队列阻塞、多线程、死锁

python多线程（三）优先级队列（ Queue）

python3多线程和队列结合学习

33、Python多线程编程互斥锁和通信队列

python中队列和多线程学习案例

python王者荣耀图片下载：队列多线程模式

Python多线程爬虫编程中队列的问题详解

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)