python爬虫使用协程——asyncio&aiohttp常用 - 代码天地

python爬虫使用协程——asyncio&aiohttp常用

企业开发 2024-11-01 19:01:43 阅读次数: 0

asyncio

基本函数

async def f_coroutine(): pass

coroutine = f_coroutine() # 返回coroutine协程对象

执行协程

loop = asyncio.get_event_loop() # 创建事件循环

loop.run_until_complete(future=coroutine) # 将协程对象注册到事件循环中

task = loop.create_task(coro=coroutine) # 使用协程对象定义task任务对象

task = asyncio.ensure_future(coro_or_future=coroutine) # 使用协程对象定义task任务对象

loop.run_until_complete(future=task) # 将task对象注册到事件循环中

tasks = []

coroutines = asyncio.wait(fs=tasks) # 使用多个task对象组成的列表来定义协程对象

loop.run_until_complete(future=coroutines) # 将协程对象注册到事件循环中

async def f_coroutine():
await asyncio.gather(*tasks) # 执行task列表中的任务，返回结果组成的列表

获取task返回结果

task.result() # task对象执行结果

def f_callback(task): pass

task.add_done_callback(fn=f_callback) # 协程对象执行完毕后，执行callback回调方法

控制最大并发量

from asyncio import Semaphore

semaphore = Semaphore(value='int') # 最大并发量

async def f_coroutine():
async with semaphore: # 并发限制
pass

aiohttp

基本函数

from aiohttp import ClientSession

async def f_get():

async with ClientSession() as session:

response = await session.get(url='') # GET请求

response = await session.get(url='', proxy='') # 网络代理，socks代理需借助‘aiohttp-socks’包进行设置

response.status # 响应状态码

response.headers # 响应头

await response.text() # 响应体

await response.read() # 响应体二进制内容

await response.json() # 响应体json结果

超时参数设置

from aiohttp import ClientTimeout

timeout = ClientTimeout(total='float') # 响应超时时间

from aiohttp import ClientSession

ClientSession(timeout=timeout) # 响应超时参数

猜你喜欢

转载自blog.csdn.net/guanxxx/article/details/138677326

python爬虫使用协程——asyncio&aiohttp常用

协程的简单应用（aiohttp,asyncio）---爬虫

python 协程并发发送请求：asyncio、aiohttp 使用

python协程爬虫-aiohttp+aiomultiprocess使用

python---aiohttp的使用 python asyncio 获取协程返回值和使用callback 500并发测试

Python协程与asyncio

python入门三十二天——协程异步IO\asyncio、async/await、aiohttp

爬虫4:单线程+多任务的异步协程(asyncio,aiohttp),selenium的基本使用,基于js加密和混淆的案列

一个使用 asyncio 协程的网络爬虫（一）

一个使用 asyncio 协程的网络爬虫

python 协程 & 异步 & asyncio

Python 协程模块 asyncio 使用指南

基于asyncio实现的异步协程爬虫

Python异步IO之协程(二):使用asyncio的不同方法实现协程

Python异步IO之协程：使用asyncio的不同方法实现协程

python爬虫之多线程threading、多进程multiprocessing、协程aiohttp 批量下载图片

aiohttp.client_exceptions.ContentTypeError：python异步协程爬虫报错

Python 中的协程 (4） asyncio模块

【python3】协程asyncio模块

异步IO协程 (asyncio) ——Python

Python 协程：yield，greenlet，gevent，asyncio

Python协程&asyncio&异步编程

Python 协程和asyncio模块

Python的协程异步IO（asyncio）详解

python链家网异步IO爬虫，使用asyncio、aiohttp和aiomysql

aiohttp及asyncio的简单使用

基于 asyncio 和 aiohttp 的异步爬虫框架（Python）！

asyncio 异步协程

asyncio协程

【老男孩】Python爬虫P45-P48aiohttp实现多任务异步协程多任务异步协程实战演练异步爬虫实战案例

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

集成学习——LightGBM原理理解

java复制pdf并且往pdf文件中添加内容

DRF的解析器和渲染器 DRF的解析器和渲染器

pytest以函数形式的测试用例

CSS3 边框

C语言编程经典案例，三种方法求水仙花数（附完整代码）

算法题（313）

css如何让背景透明，文字不透明

linux下网络程序遭遇SIGPIPE的解决（转）

用xposed Hook框架Hook 安卓apk的按钮Id

每日归档

更多

2025-04-13(999)

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)