对上一篇中settings.py中的一些操作的解释 - 代码天地

对上一篇中settings.py中的一些操作的解释

其他 2018-08-16 05:30:58 阅读次数: 0

如下是在一个 scrapy-redis爬虫应用模板中的一个，并进行了注解，具体如下

# Scrapy settings for example project
#
# For simplicity, this file contains only the most important settings by
# default. All the other settings are documented here:
#
#     http://doc.scrapy.org/topics/settings.html
#
SPIDER_MODULES = ['example.spiders']
NEWSPIDER_MODULE = 'example.spiders'

USER_AGENT = 'scrapy-redis (+https://github.com/rolando/scrapy-redis)'
# 使用scrapy redis的去重类 不适用scrapy默认的去重类
DUPEFILTER_CLASS = "scrapy_redis.dupefilter.RFPDupeFilter"
# 使用scrapy__redis的调度器，不适用scrapy默认的调度器
SCHEDULER = "scrapy_redis.scheduler.Scheduler"
# 控制爬虫是否允许暂停
SCHEDULER_PERSIST = True
# 队列形式 先进先出  哪个请求先放入到请求队列 哪个请求就先执行
#SCHEDULER_QUEUE_CLASS = "scrapy_redis.queue.SpiderPriorityQueue"
# 栈形式 先进后出
#SCHEDULER_QUEUE_CLASS = "scrapy_redis.queue.SpiderQueue"

#SCHEDULER_QUEUE_CLASS = "scrapy_redis.queue.SpiderStack"

ITEM_PIPELINES = {
    'example.pipelines.ExamplePipeline': 300,
    # 使用redis数据库所要添加的管道，如果使用redis数据库 必须添加
    'scrapy_redis.pipelines.RedisPipeline': 400,
}
# log 日志 level 等级
# debug 调试
LOG_LEVEL = 'DEBUG'

# Introduce an artifical delay to make use of parallelism. to speed up the
# crawl.
# 为了限制爬虫速度
DOWNLOAD_DELAY = 1

猜你喜欢

转载自blog.csdn.net/weixin_42539547/article/details/81710374

对上一篇中settings.py中的一些操作的解释

Django中的settings.py介绍

settings.py中配置静态文件

scrapy中的settings.py文件详情

Django中settings.py配置

scrapy 中 settings.py 中字段的意思

scrapy 中settings.py配置文件详解

django读写配置settings.py中内容

lingo中的一些概念解释

对上一篇Logstash的补充

Git使用中的一些命令（承接上一篇git规范的博客）

settings.py的设置

settings.py

django settings.py

Django中关于ORM数据库中的操作————（主要是models.py的设计（数据表的设计）与settings.py 的配置）

LoadRunner中的一些性能名词解释（一）

numpy中的一些函数操作

jquery中对select的一些操作

linux中vi的一些操作

vi中的一些快捷操作

EditPlus中的一些操作

Hadoop中的一些基本操作

Oracle中的一些基本操作

Octave中的一些常用操作

jsp中的一些操作记录

Java中Date的一些操作

【Pandas】Pandas中的一些操作

Excel中的一些基础操作

记录一些在Linux中的操作

LoadRunner中的一些性能名词解释（二）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)