Spider Note1 http协议

其他 2019-01-01 10:11:07 阅读次数: 0

声明：该笔记为学习黑马程序员爬虫视频的时候整理的，纯属笔记，无其他意图。

文章目录

爬虫地址
http协议与https协议
http协议之请求

get请求与post请求
请求

http协议之响应

爬虫地址

爬虫地址URL为网页源码Name栏首个文件对应network标签下的Request URL
elements的内容与爬虫获取到的URL地址响应不同，因为elements内容包括：URL响应+js+css+图片，而爬虫只包含第一部分。

http协议与https协议

http协议（超文本传输协议）：
- 以明文形式传输
- 效率高但不安全
https协议（http+ssl安全套接字层）：
- 传输之前数据先加密，之后解密获取内容
- 效率低但安全

http协议之请求

get请求与post请求

get没有请求体，get请求把数据放到URL地址中；post有请求体，post请求把数据放到请求体中。
- post常用于登录注册，post携带的数据量比get大，常用于传输大文本的时候。

请求

请求行（General）
- Request URL
- Request Method（get/post）
- Status Code（状态：是否正常）
请求头（Request Headers 点击 view source）
- 第一块：Request Method + URL（除去域名之前的部分）+协议版本
- 域名Host
- Connection（连接方式）：keep-alive（长连接，开始接通，结束断开）/暂时知道这一个
- User-Agent（用户代理）：用来模拟浏览器
- Cookie：用来存储用户信息的，每次请求都会被携带上发送给对方服务器。（一般只关注Name和Value就够了）
  - 要获取登陆才能访问的页面
  - 对方服务器会根据Cookie判断是否是爬虫。
请求体
- 携带数据。

http协议之响应

响应头
- Set-Cookie：对方服务器通过该字段设置Cookie到本地。
响应体
- URL地址对应的响应。

猜你喜欢

转载自blog.csdn.net/l_changyun/article/details/84781809

Spider Note1 http协议

pandas note1

numpy note1

note1

struts note1

flask note1

linux note1

python spider note

Thinking in java note1

开发架构note1

Spider——requests模块（HTTP for Humans）

HTTP 协议Note

spider

Unity3d Note1

Note1:iOS开发笔记

Effective C++ Note1

note1【商业营销中的色彩】

iOS视频直播开发note1

考研数学Note1—划分框架

Spider Note2 requests模块

Spider Note3数据提取方法

1.Python通用Spider

spider之robots协议（新人小结）

（1）HTTP协议

HTTP协议1

http协议（1）

HTTP协议详解(1)

斯坦福机器学习课件NOTE1总结

魅蓝note1安装xposed问题及方法

Matlab入门基础 note1——赋值与小数

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)