cookie的配置和使用

一.引导

可扩展的Cookies池,目前对接了新浪微博,m.weibo.cn,可自行扩展其他站点

使用 Cookie池,定期的检查Cookie是否失效,可以将多个账号登录之后的Cookie保存在池子中,在爬取网站时,可以随机获取一个账号的登录Cookie,实现多账号爬取的功能。

二.下载及相关配置

可参考文档:https://github.com/Python3WebSpider/CookiesPool

下载地址:https://github.com/Germey/CookiesPool

下载后解压得到的文件夹结构如下:


1.打开requirements.txt(如下图所示),看看你的这四个包的版本是否满足要求(要保证这四个包的版本满足其要求)


扫描二维码关注公众号,回复: 2239995 查看本文章

2.打开cookiespool文件夹下的config.py,将相关字段的值更改下图中所示即可


3.打开cookiespool文件夹下的generator.py,将相关字段的值更改下图中所示即可


4.运行cookiespool文件夹下的importer.py

以新浪微博为例,在控制台中输入其账号密码组即可


5.运行login文件夹下的run.py

运行效果如下:


6.随机获取Cookies

打开浏览器,在地址栏上输入: http://localhost:5000/weibo/random即可随机获取Cookies


一.引导

可扩展的Cookies池,目前对接了新浪微博,m.weibo.cn,可自行扩展其他站点

使用 Cookie池,定期的检查Cookie是否失效,可以将多个账号登录之后的Cookie保存在池子中,在爬取网站时,可以随机获取一个账号的登录Cookie,实现多账号爬取的功能。

二.下载及相关配置

可参考文档:https://github.com/Python3WebSpider/CookiesPool

下载地址:https://github.com/Germey/CookiesPool

下载后解压得到的文件夹结构如下:


1.打开requirements.txt(如下图所示),看看你的这四个包的版本是否满足要求(要保证这四个包的版本满足其要求)


2.打开cookiespool文件夹下的config.py,将相关字段的值更改下图中所示即可


3.打开cookiespool文件夹下的generator.py,将相关字段的值更改下图中所示即可


4.运行cookiespool文件夹下的importer.py

以新浪微博为例,在控制台中输入其账号密码组即可


5.运行login文件夹下的run.py

运行效果如下:


6.随机获取Cookies

打开浏览器,在地址栏上输入: http://localhost:5000/weibo/random即可随机获取Cookies


猜你喜欢

转载自blog.csdn.net/weixin_42336553/article/details/80977970