关于Python Scrapy框架 yield scrapy.Request(next_url, call_back="")无法翻页情况解决

其他 2018-10-31 04:31:29 阅读次数: 0

错误的代码:


class XXSpider(scrapy.Spider):
    name = 'xxspider'
    allowed_domains = ['https://www.xx.com']
    start_urls = ['https://www.xx.com/ask/highlight/']

正确的代码:

class XXSpider(scrapy.Spider):
    name = 'xxspider'
    allowed_domains = ['www.xx.com']
    start_urls = ['https://www.xx.com/ask/highlight/']

这里, allowed_domains中域名设置问题, Request需要的是一组域名而不是一组url

还有一情况也会导致yield scrapy.Request()失效:

系统don't_filter将该Url过滤掉了

解决方案:

yield scrapy.Request(next_url, call_back=self.parse, dont_filter=True)

猜你喜欢

转载自blog.csdn.net/Li_G_yuan/article/details/81589556

关于Python Scrapy框架 yield scrapy.Request(next_url, call_back="")无法翻页情况解决

scrapy爬虫框架 (2. logging模块的使用、yield scrapy.Request()函数间传参)

需要解决的问题：scrapy框架yield和return

scrapy-yield scrapy.Request()不执行、失效、Filtered offsite request to错误 [转]

Scrapy框架的学习(5.scarpy实现翻页爬虫，以及scrapy.Request的相关参数介绍)

关于scrapy中scrapy.Request中的属性

scrapy爬虫框架（四）：scrapy中 yield使用详解

关于Scrapy框架中yield方法和Downloader中间件的讲解

python scrapy.Request传递给parse参数的方法

爬虫scrapy框架（4）——yield关键字

关于python爬虫框架scrapy的安装

scrapy 框架 python 爬虫

python爬虫-scrapy框架

python爬虫scrapy框架

python安装scrapy框架

Python爬虫框架—Scrapy

Python爬虫框架Scrapy

python Scrapy框架

python爬虫--scrapy框架

python：爬虫：Scrapy框架

Python爬虫---scrapy框架

python之scrapy框架

Python爬虫—scrapy框架

python 的scrapy框架

python-scrapy框架

python的scrapy框架：Attribute Error module ‘scrapy’ has no attribute ‘Request’（scrapy找不到request）

Python3 Scrapy爬虫框架(Scrapy/scrapy-redis)

scrapy parse()中 yield的作用分析

Python yield与send，iter与next

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)