【路飞学城第七模块考核】 - 代码天地

【路飞学城第七模块考核】

其他 2018-11-28 08:51:22 阅读次数: 0

一． Requests模块
1. 1. 简述爬虫的概念
2. 2. 爬虫有几种分类，在使用场景中
3. 3. 简述robots协议的概念也作用
4. 4. 什么是反爬机制和反反爬机制
5. 5. 简述使用requests模块进行数据爬取的大致流程
6. 6. 简述使用requests模块爬取ajax加载数据爬取的大致流程
7. 7. 简述User-Agent参数的作用
8. 8. 在requests模块中接触过哪些反爬机制
9. 9. 介绍下requests模块中get和post方法常用参数的作用
10. 10. 简述session的创建流程及其该对象的作用
11. 11. 简述如何使用requests模块进行模拟登录，并抓取登录成功后的某个二级页面数据。
12. 12. 简述如何使用requests模块设置代理IP
二．数据解析
1. 1. 简述使用在使用正则进行解析时用到的re.S和re.M的作用和区别
2. 2. 简述如何使用xpath进行数据解析
3. 3. 简述如何使用bs4进行数据解析
4. 4. xpath方法返回值类型是什么
5. 5. 在xpath中如何/text()和//text()的区别是什么
6. 6. id为su的div标签有一个子标签ul，ul下有十个li标签，每一个li标签下都有一个a标签，如何编写xpath表达式可以解析到a标签的href属性值

　　　　　　7. class为wd的div标签有一个子标签ul，ul下有十个li标签，每一个li标签下都有一个a标签，如何编写xpath表达式可以解析到a标签中的文本内容

　　　　　　8. 简述BeautifulSoup模块中find和findall方法的区别

　　　　　　9. 简述BeautifulSoup模块中select方法的使用

　　　　　　10. 简述xpath插件的作用

三． Scrapy框架
1. 1. 简述scrapy框架的安装流程
2. 2. scrapy中持久化操作有几种形式，分别如何实现？
3. 3. 简述start_requests方法的作用
4. 4. 如何进行post请求发送，在scrapy中
5. 5. 如何手动进行一个get请求的发送，在scrapy中
6. 6. 简述管道文件的作用
7. 7. 简述Request方法中callback参数的作用
8. 8. 简述Request方法中meta参数的作用
9. 9. 简述下载中间件的作用
10. 10. 简述如何设置scrapy项目的代理IP
11. 11. 简述CrawlSpider中链接提取器的作用
12. 12. 简述CrawlSpider中规则解析器的作用
13. 13. 简述scrapy核心组件的工作原理
14. 14. 原生scrapy框架为何不能实现分布式
15. 15. 简述基于scrapy-redis分布式的流程

猜你喜欢

转载自www.cnblogs.com/pandaboy1123/p/10030055.html

【路飞学城第七模块考核】

路飞学城Python-Day6（考核模块思维导图）

路飞学城Python-Day16(第二模块考核总结)

路飞学城模块一总结

路飞学城之认证登录模块

路飞学城项目-课程模块

路飞学城

路飞学城项目

面试准备之七路飞学城

路飞学城项目-登陆认证模块

路飞学城项目总结

docker部署路飞学城

linux⑦路飞学城部署

路飞学城部署方法

路飞学城Python-Day29（第四模块-并发编程）

路飞学城Python-Day59(第五模块复习题)

路飞学城Python-Day59(第五模块记录)

路飞学城之Alipay配置

路飞学城Python-Day2

路飞学城Python-Day10

路飞学城python入门笔记03

路飞学城python入门笔记02

路飞学城python入门笔记01

路飞学城Python-Day8

路飞学城Python-Day9

路飞学城Python-Day3

路飞学城Python-Day4

路飞学城爬虫实战笔记（三）

路飞学城Python-Day18

路飞学城Python-Day6

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)