Scrapy中传入自定义参数 - 代码天地

Scrapy中传入自定义参数

其他 2021-03-24 16:34:29 阅读次数: 0

通常我们执行Scrapy的时候是类似这样的：scrapy crawl spiderName

在加入参数后我们可以这样执行：
scrapy crawl spiderName -a parameter1=value1 -a parameter2=value2

爬虫文件中可以获取这些参数：
class MySpider(Spider):
name = 'myspider'
...
def parse(self, response):
...
if self.parameter1 == value1:
# this is True

# or also
if getattr(self, parameter2) == value2:
# this is also True

通过使用-a可以向爬虫文件中定义的类传递属性，然后在该类中获取该属性即可实现传入自定义参数。

通过命令：scrapy crawl quotes -a num=7来执行
通过-a参数传递的变量其实就是通过初始化方法传递进来的，当然也可以自定义这样的方法：
import scrapy

class QuotesSpider(scrapy.Spider):
name = 'quotes'
allowed_domains = ['quotes.com']

def __init__(self,num='', *args,**kwargs):
super().__init__(*args, **kwargs)
self.num = num
self.start_urls = [f'http://quotes.com/{self.num}']

当然还可以通过getattr来获取对象的属性：
import scrapy

class QuotesSpider(scrapy.Spider):
name = 'quotes'
allowed_domains = ['quotes.com']

def start_requests(self):
num = getattr(self, num, False)
if num:
url = f'hppt://quotes.com/{num}'
yield scrapy.Request(url)

猜你喜欢

转载自blog.csdn.net/Kwoky/article/details/110621882

Scrapy中传入自定义参数

python scrapy 传入自定义参数需要注意的几点

关于 Scrapy 中自定义 Spider 传递参数问题

vue中需要获取事件参数并且传入自定义参数

js 如何在有默认参数的方法中，增加传入自定义参数

myBatis自定义传入参数类型(TypeHandler)

Flask 自定义过滤器多个参数传入

vue同时传入自定义参数和事件对象

Taro UI vue 事件绑定传入自定义参数

springboot 使用自定义注解校验传入参数

pyqt5学习笔记：自定义参数（给信号传入参数）

@click同时传入事件对象和自定义参数 @click绑定的函数，如何同时传入事件对象和自定义参数

Scrapy中如何向Spider传入参数

SpringBoot中自定义参数绑定

在gradle中配置自定义参数

读取django中自定义参数

TypeScript--ts中自定义方法传入参数,对json进行约束，接口，可选参数，ts接口完整ajax封装

自定义scrapy的RetryMiddleware

scrapy 自定义扩展

scrapy 自定义pipline

scrapy 自定义代理

自定义函数:传入值

Scrapy配置自定义scrapy命令

vue click同时传入事件对象和自定义参数

HtmlWebpackPlugin（html-webpack-plugin）传入自定义参数到模板

vue @click 绑定的函数，如何同时传入事件对象 e 和自定义参数

Vue Click事件同时传入时间对象和自定义参数

（二）scrapy 中如何自定义 pipeline 下载图片

RT-Thread中自定义MSH命令传入的参数是字符串，需用户自行检查和解析

关于Android 的自定义 View 中单个属性传入一组数据的方案

今日推荐

周排行

daidingdaiding——BP箱线图应用

log4j.xml配置文件

在python3中安装mysql扩展，No module named 'ConfigParser'

如何点亮qq图标?

JAVAFX图像问题

什么是Serverless?

PropertyPlaceholderConfigurer扩展---spring读取properties配置文件

习惯学生开始上网网友：学生们缓缓下线张雨

链表相关知识总结

大话设计模式 —— 模板方法模式

每日归档

更多

2025-03-11(0)

2025-03-10(0)

2025-03-09(0)

2025-03-08(0)

2025-03-07(0)

2025-03-06(0)

2025-03-05(0)

2025-03-04(0)

2025-03-03(0)

2025-03-02(0)