Python爬虫系列
@(博客)[Python, 爬虫]
背景
由于近来学(lan)业(ai)繁(fa)忙(zuo),快一个月没有更新博客了。这周完成了两门课的结课考试,现下时间开始变得充裕。准备梳理一下前段时间学习的关于Python爬虫的内容,权当复习巩固知识。而初次学习时遇到的疑难杂症,那时候的应对策略是抓大放下,在这梳理过程会下定决心一一攻克。
由于本人技术有限,错漏处还望各友不吝赐教。
梳理知识点
- python2:urllib2爬虫
- python3:Requests爬虫
- xpath的使用
- Tesseract的使用
- Selenium与PhantomJS
- scrapy下载图片实例
- scrapy 模拟登陆
- scrapy数据写入MySOL, MongoDB
- scrapy-redis使用
说明:需要梳理的知识点,大致为这些,等全部写完后会做成链接实现跳转,并且根据实际情况目录会有相应的调整