Scrapy的callback进入不了回调方法 - 代码天地

Scrapy的callback进入不了回调方法

企业开发 2023-04-08 07:24:52 阅读次数: 0

一、前言

有的时候，Scrapy的callback方法直接被略过了，不去执行其中的回调方法，可能排查好久都排查不出来，我来教大家集中解决方法。

yield Request(url=url, callback=self.parse_detail, cb_kwargs={
    
    'item': item})

二、解决方法

1、url可能被过滤掉了，如果是被scrapy过滤掉了，那就只需要在这个 scrapy.Request() 函数中将参数放入dont_filter=True加入进去。

2、如果发现还是不行，就可能是因为allowed_domains这个赋值的时候赋值的是别的url，其实可以直接把这个注释掉直接不用。

3、仍然无法使用的话，首先那就要看网站协议了，直接在网站中查看输入：https://www.tencent.com/robots.txt 这里就可以看到：

在这里插入图片描述

这里是没有限制的，那么的话按照前两个按照操作就可以正常的回调了

4、如果不行就要打开配置文件settings.py，这里的False表示忽略网站的robots.txt协议，默认为True：

ROBOTSTXT_OBEY = False

把这个设置为False再试下就可以进行回调了。

5、重点来了！！！！如果以下方法还是没有解决问题的话，并且执行日志如下种形式：你有没有想过一种可能，其实你的代码是能正常执行回调函数的！！

你没有看错，你的代码就是对的！！！！那日志里面为什么不出现执行回调函数的信息呢？？

原因：程序不是进不了回调方法，是并发数设置的太大，然后页面数量又比较多，Scrapy框架呢又是先把全部页面的请求排到队列中，然后才会去执行回调中的函数，所以前面的日志都是发出请求的日志，只有全部页面都发出请求进入队列之后，才会去爬取数据进入回调方法，所以等久一点就能看到进入回调的日志了。（注意：Scrapy不是先把全部页面的请求排到队列中，然后才会去执行回调中的函数，我这里只是为了方便解释才这么说的，反正大概就是这个意思）

解决方法：如果你认为是进入不了回调方法，并且爬取的页面数量又比较多的话，可以把并发数设置小一点再测试。

在这里插入图片描述

我设置成128之后，完美看到进入回调函数的日志！！

参考文章：https://www.cnblogs.com/zhengxianfa/p/16741295.html

猜你喜欢

转载自blog.csdn.net/qq_47188967/article/details/129755703

Scrapy的callback进入不了回调方法

【回调函数】callback的使用方法 callback && callback();。。。。。。。。。。。callback

白话回调(CallBack)方法

scrapy爬虫文件中为什么不执行callback中的回调函数

回调（callback）

callback 回调函数

回调函数 callback()

callback(回调函数)

回调函数callback()

回调函数callback()

回调函数（callback）

callback回调机制

AndroidStudio debug模式调试进入不了回调方法中的断点

回调函数callback&&callback()

JQ Callback 回调函数

python callback 回调函数

callback回调函数【转】

JS回调函数(callback)

javascript~callback回调函数

python 回调函数（Callback）

Ajax的回调函数(callback)

java 回调机制（callback）

callback回调函数的理解

什么是回调函数？ Callback

关于回调函数（callback）

Android开发——回调（Callback）

回调函数(CALLBACK)的作用

Java-回调/Callback

回调函数callback的作用

什么是回调函数CallBack

今日推荐

wlnmp 一键安装包更新 240522

ChatGPT 严重宕机，结果被造谣“遭遇俄罗斯黑客入侵”

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

周排行

mongodb 下载与安装与初步使用

20190530

iOS录制回放神器AutoTouch使用介绍

同心圆猜数字游戏

mamp pro安装redis扩展各个步骤截图

windows10下安装docker报错：error during connect

跨域授权 Federated Identity Pattern

js时间比较大小

pandas to_csv()使用方法

从JDK源码角度看Byte

每日归档

更多

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)