爬虫基础B1——Scrapy(B站学习笔记)

编程语言 2022-08-16 04:17

0 阅读

目录

1. 基本概念

2. Pychram中的Scrapy

3.一个解析页面的基本说明（CCS选择器的使用）

4. 利用Items.py接收数据

5.在Setting.py中设置爬虫伪装

6.运行爬虫项目并保存为SCV文件

7. 分页爬取豆瓣数据

1. 基本概念

扫描二维码关注公众号，回复： 14487118 查看本文章

2. Pychram中的Scrapy

3.一个解析页面的基本说明（CCS选择器的使用）

4. 利用Items.py接收数据

items.py文件中：

实例化MovieItem()，得到movie_item对象，并将css选择器提取的页面数据存入movie_item对象中：

5.在Setting.py中设置爬虫伪装

6.运行爬虫项目并保存为SCV文件

7. 分页爬取豆瓣数据