Python爬虫开发-03--使用headers爬取网页的简单模型 - 代码天地

Python爬虫开发-03--使用headers爬取网页的简单模型

编程语言 2018-05-14 03:46:45 阅读次数: 0

# encoding:utf-8
import urllib
import urllib2

# 请求
url = 'https://www.zhihu.com/#signin'
'''
	但是有时候服务器会检查请求头，判断是否来自浏览器的访问，这是反爬虫的常用手段
	这时候需要对程序作出修改——增添请求头信息
'''
	# 加上请求头信息，设置请求头中的User-Agent域和Referer域信息，Referer是为了判断你是从哪个链接找到我这个URL的
user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'
referer = 'https://www.zhihu.com/'

postdata = {
	'username':'lin',
	'password':'abc123'
}

# 将user_agent, referer写入头信息中
'''
headers = {
	'User-Agent': user_agent, 'Referer': referer
}
'''

# 转换请求头格式
data = urllib.urlencode(postdata)
# req = urllib2.Request(url, data, headers)

req = urllib2.Request(url)
# 还可以通过add_header添加请求头信息
req.add_header('User-Agent', user_agent)
req.add_header('Referer', referer)
req.add_data(data)

# 响应
response = urllib2.urlopen(req)

# 输出
html = response.read()
print html

猜你喜欢

转载自blog.csdn.net/Sarline/article/details/80286995

Python爬虫开发-03--使用headers爬取网页的简单模型

使用Python爬虫爬取简单网页（Python爬虫入门）

Python 爬虫学习03 具体爬取网页的实现

03--构造爬虫爬腾讯招聘,实现翻页爬取

Python 爬虫爬取网页

python3爬虫爬取网页图片简单示例

python爬虫入门（1）简单爬取网页源码

Python爬虫学习（一）使用Requests和正则表达式爬取简单网页

python爬取简单网页

python 爬虫系列03--职位爬虫

python爬虫01-使用urllib爬取网页

Python使用爬虫ip爬取动态网页

爬虫基本流程及简单爬取网页

Python爬取网页图片03

python爬虫爬取淘宝网页

python爬虫爬取京东网页

Python爬虫爬取网页的例子

Python——网络爬虫（爬取网页图片）

python 爬虫（爬取网页的img并下载）

python爬虫——爬取网页的中文

Python爬虫入门——爬取网页图片

python爬虫爬取网页图片

Python爬虫-1——爬取网页

python爬虫：批量爬取网页图片

Python网络爬虫实现HTTP请求、解析网页和数据存储（简单静态网页爬取）

Python 爬取图片、视频简单模板

使用Python原生爬虫爬取博客文章的简单信息

Python - Python 简单爬取网页内容

python简单爬虫爬取百度百科python词条网页

python requests 简单网页文本爬取

今日推荐

wlnmp 一键安装包更新 240522

ChatGPT 严重宕机，结果被造谣“遭遇俄罗斯黑客入侵”

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

周排行

mongodb 下载与安装与初步使用

20190530

iOS录制回放神器AutoTouch使用介绍

同心圆猜数字游戏

mamp pro安装redis扩展各个步骤截图

windows10下安装docker报错：error during connect

跨域授权 Federated Identity Pattern

js时间比较大小

pandas to_csv()使用方法

从JDK源码角度看Byte

每日归档

更多

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)