python爬数据，天气预报返回403 - 代码天地

python爬数据，天气预报返回403

其他 2019-01-10 19:54:47 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载 https://blog.csdn.net/qq983392709/article/details/84846612

爬数据的时候，一般网站获取数据访问的动态js文件是可以直接访问的，用普通

request = urllib.request.urlopen(url)
res = request.read()

就可以获取

而有的不能直接获取，返回403报错，意思是访问不到，

而这种明明有数据，服务器就是不给你返回数据的链接，可以使用加headers的方式，模拟网页环境


headers = {
	'Accept': '*/*',
	# 不要采用 gzip（压缩格式），数据会变乱码
	# 'Accept-Encoding': 'gzip, deflate',
	'Accept-Encoding': 'deflate',
	'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8',
	'Connection': 'keep-alive',
	'Host': 'd1.weather.com.cn',
	'Referer': 'http://www.weather.com.cn/weather40d/101110101.shtml',
	'User-Agent': 'Mozilla/5.0 (iPad; CPU OS 11_0 like Mac OS X) AppleWebKit/604.1.34 (KHTML, like Gecko) Version/11.0 Mobile/15A5341f Safari/604.1'
}

这里访问的是中国天气网的数据，

url=‘http://d1.weather.com.cn/calendar_new/2018/101110101_201806.html?_=1544002167834’

需要匹配的参数是headers中的Host和Referer

之后使用

req = urllib.request.Request(url=url,data=None,headers=headers)
request = urllib.request.urlopen(url)
res = request.read()

就可以访问了

当然，在访问普通的url（无403错误）时，也可以加herders

猜你喜欢

转载自blog.csdn.net/qq983392709/article/details/84846612

python爬数据，天气预报返回403

天气预报（四）三种不同的获取js返回数据的方法

python 爬取天气预报

python爬取网页天气预报

Python 天气预报

使用python爬取天气预报，[python入门案例]

python爬取天气预报数据，并实现数据可视化

Python实现定时爬取未来15天的天气预报存入Mysql数据库

Python爬虫学习：用API爬取天气预报数据

【爬虫学习二】 python通过API爬取各城市天气预报数据

python爬虫-爬取天气预报内容

python利用xpath爬取天气预报信息

python爬取天气预报用163邮箱发

24.API爬天气预报数据

和风api爬取天气预报数据

免费天气预报接口返回15天的天气JSON格式

Python天气预报查询

爬取天气预报内容

deqin -深度爬取天气预报

runze - 学习爬去天气预报

ziheng - 爬取天气预报

java 通过调用SOAP消息获得服务器返回的schema文件天气预报的webservice

笔记六：python之获取接口数据_天气预报

Python从网络接口爬取json天气预报数据绘制高温低温双折线图

Python：爬取天气并设计制作天气预报对话框

天气预报：天气数据集爬取 + 可视化 + 13种模型预测

Python 天气预报+微信

Python查北京天气预报

python爬虫----全国天气预报的获取

python学习之路——爬虫天气预报

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)