python爬虫之cookie的HTTPCookieProcessor - 代码天地

python爬虫之cookie的HTTPCookieProcessor

其他 2019-10-27 11:26:17 阅读次数: 0

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接： https://blog.csdn.net/qq_40605167/article/details/81265826

通过阅读源码我们可以知道，我们在调用urllib2.urlopen(url)的时候，其实urllib2在open函数内部创建了一个默认的opener对象。然后调用opener.open()函数。
但是默认的opener并不支持cookie。
那么我们先新建一个支持cookie的opener。urllib2中供我们使用的是HTTPCookieProcessor。

创建HTTPCookieProcessor需要闯入一个存放cookie的容器。
Python提供的存放cookie的容器位于cookielib，有以下几个。
CookieJar -> FileCookieJar -> MozillaCookieJar / LWPCookieJar
经典模板

# cookie:爬虫维持登陆状态的机制
import http.cookiejar,urllib.request
cookie = http.cookiejar.CookieJar() # 声明cookiejar的对象,存放cookie的容器
handler = urllib.request.HTTPCookieProcessor(cookie)
opener = urllib.request.build_opener(handler)
response = opener.open('http://www.zhihu.com')
for item in cookie:
    print(item.name + '=' + item.value)

打印结果

_xsrf=VbG7xdp2zmhpVdphwEjLtG5rrx5mCax8
_zap=a1505863-682f-48ac-afb8-8cf9dcf4bc8a
d_c0="APBm9PZb-A2PTkv5XT1fHtUgjd3gx61CD00=|1532785405"
q_c1=600dcae83fe04a189a555cb68d3a081d|1532785405000|1532785405000
tgw_l7_route=61066e97b5b7b3b0daad1bff47134a22

Process finished with exit code 0

猜你喜欢

转载自blog.csdn.net/qq_40605167/article/details/81265826

python爬虫之cookie的HTTPCookieProcessor

Python之爬虫-- cookie & session

python爬虫之代理与Cookie

Python爬虫入门六之Cookie的使用

Python之爬虫-- cookie & session（二）

Python爬虫之（五）Cookie和URLError

python爬虫之Cookie和Session

python爬虫之---------------cookie和session

python爬虫之POST登录方式之Cookie、Session

爬虫之cookie与代理

爬虫之cookie

Python爬虫：Cookie的使用

Python爬虫——使用Cookie

Python爬虫_Cookie

Python爬虫-----什么是Cookie

python爬虫(十二)-------------------cookie

python爬虫操作cookie

【python爬虫】cookie & session

python爬虫 - cookie

python爬虫（六） Cookie

【Python】爬虫-----处理cookie

芝麻HTTP：Python爬虫入门之Cookie的使用

Python爬虫番外篇之Cookie和Session

Python爬虫urllib之cookie文件的保存和访问

python爬虫之使用静态Cookie模拟用户登录

Python爬虫入门：Cookie的使用

python爬虫中的cookie详解

python爬虫cookie方面(1)

python使用cookie爬虫脚本

Python爬虫动态获取Cookie

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)