pathon 多进程爬虫 - 代码天地

pathon 多进程爬虫

其他 2021-03-06 06:03:24 阅读次数: 0

#-*-coding:utf8-*-

from multiprocessing.dummy import Pool as ThreadPool
import requests
import time

def getsource(url):
    html = requests.get(url)

urls = []

for i in range(1,21):
    newpage = 'http://tieba.baidu.com/p/3522395718?pn=' + str(i)
    urls.append(newpage)

time1 = time.time()
for i in urls:
    print i
    getsource(i)
time2 = time.time()
print u'单线程耗时：' + str(time2-time1)

pool = ThreadPool(4)
time3 = time.time()
results = pool.map(getsource, urls)
pool.close()
pool.join()
time4 = time.time()
print u'并行耗时：' + str(time4-time3)

猜你喜欢

转载自blog.csdn.net/luoxiping1/article/details/79871298

pathon 多进程爬虫

Python爬虫1——pathon爬虫原理

爬虫多进程

多进程爬虫

pathon爬虫之request模块的使用

PHP多进程网络爬虫

python 爬虫保存图片/多进程

python 爬虫多线程/多进程

python爬虫多进程的使用：multiprocessing

Python爬虫之多线程，多进程

Python爬虫，多进程 + 日志记录

爬虫--多进程爬取妹子图

Python爬虫之多进程浅谈

python给爬虫加速：多线程，多进程

06讲：python爬虫之多进程

Python实现多线程、多进程爬虫

python爬虫效率提升——多进程

爬虫学习之12：多进程爬虫初试

python多进程爬虫解决进程挂掉问题

pathon爬虫中简单的请求头fake_useragent库，处理反爬问题

五 Pathon爬虫之抓包与反爬以及反爬解决方案

Python爬虫(7):多进程抓取拉钩网十万数据

多进程面向对象爬虫程序

Python爬虫多进程包multiprocessing中，pool组件的使用

python之多进程和多协成爬虫

[python爬虫] 使用多进程爬取妹子图

Boss直聘网requests多进程爬虫，写入Mysql

PHP通过pcntl扩展使用redis队列多进程爬虫

爬虫--多线程-多进程-协程以及池的使用

Python使用多进程提高网络爬虫的爬取速度

今日推荐

周排行

Sping整合ActiveMQ（五.常见错误分析）

jquery ajax发送请求实例模板

北风设计模式课程---24、迭代模式

[Luogu] 兽径管理

1030 Travel Plan （30 分）(dijkstra算法+dfs+边权)

springboot-shiro中的问题

数据访问安全代理 CASB

RocketMQ与Kafka对比

Rider 2019.3.3 发布，跨平台 .NET IDE

Ubuntu切换root su -

每日归档

更多

2025-03-17(0)

2025-03-16(0)

2025-03-15(0)

2025-03-14(0)

2025-03-13(0)

2025-03-12(0)

2025-03-11(0)

2025-03-10(0)

2025-03-09(0)

2025-03-08(0)