scrapy框架介绍及安装 - 代码天地

scrapy框架介绍及安装

其他 2018-05-08 23:00:00 阅读次数: 4

什么是scrapy框架？

scrapy框架的安装

1.windowes下的安装

Python 2 / 3
升级pip版本：

pip install --upgrade pip

通过pip 安装 Scrapy 框架

pip install scrapy

2.Ubuntu下的安装

Ubuntu 需要9.10或以上版本安装方式
Python 2 / 3
安装非Python的依赖

sudo apt-get install python-dev python-pip libxml2-dev libxslt1-dev zlib1g-dev libffi-dev libssl-dev

通过pip 安装 Scrapy 框架

sudo pip install scrapy

具体Scrapy安装流程参考：http://doc.scrapy.org/en/latest/intro/install.html#intro-install-platform-notes 里面有各个平台的安装方法

3.scrapy的运行流程

Scrapy构架解析：Scrapy Engine(引擎): 负责Spider、ItemPipeline、Downloader、Scheduler中间的通讯，信号、数据传递等。

Scheduler(调度器): 它负责接受引擎发送过来的Request请求，并按照一定的方式进行整理排列，入队，当引擎需要时，交还给引擎。

Downloader（下载器）：负责下载Scrapy Engine(引擎)发送的所有Requests请求，并将其获取到的Responses交还给Scrapy Engine(引擎)，由引擎交给Spider来处理，

Spider（爬虫）：它负责处理所有Responses,从中分析提取数据，获取Item字段需要的数据，并将需要跟进的URL提交给引擎，再次进入Scheduler(调度器)，

Item Pipeline(管道)：它负责处理Spider中获取到的Item，并进行进行后期处理（详细分析、过滤、存储等）的地方.

Downloader Middlewares（下载中间件）：你可以当作是一个可以自定义扩展下载功能的组件。

Spider Middlewares（Spider中间件）：你可以理解为是一个可以自定扩展和操作引擎和Spider中间通信的功能组件（比如进入Spider的Responses;和从Spider出去的Requests）

4.部分问题解答

猜你喜欢

转载自www.cnblogs.com/pythoner6833/p/9012292.html

scrapy框架介绍及安装

爬虫 - Scrapy 框架介绍与安装

Scrapy爬虫框架安装与介绍

scrapy框架的介绍

Scrapy框架介绍

Scrapy 框架介绍

scrapy爬虫框架介绍

Scrapy 框架介绍及入门

爬虫scrapy框架介绍

【爬虫框架】Scrapy介绍

Scrapy框架学习（一）Scrapy框架介绍

python爬虫随笔-scrapy框架(1)——scrapy框架的安装和结构介绍

Python 中scrapy 的框架安装以及简单介绍

[爬虫框架scrapy]scrapy的安装

Scrapy:安装介绍

Python 分布式爬虫框架 Scrapy 4-2 Scrapy安装以及目录结构介绍

Scrapy框架学习 - Scrapy框架的安装与使用

Scrapy框架的安装及使用

Scrapy框架的安装问题

scrapy 框架的下载及安装

scrapy框架的安装

安装scrapy框架

python安装scrapy框架

Scrapy框架----02安装

scrapy框架---安装

爬虫框架scrapy安装

Scrapy框架的安装（windows）

安装Scrapy爬虫框架

scrapy框架安装

爬虫框架scrapy的安装

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)