网页源代码与开发者工具里打开的代码有何区别?在爬取网页是我们该如何进行选择?(网页源代码,框架源代码,开发者工具三者的联系)

网页源代码与开发者工具里打开的代码有何区别?在爬取网页是我们该如何进行选择?

希望你可以不浪费读我这篇文章的时间,可以从中有所学,有所成长!!!冲冲冲(ง •_•)ง

大家在产生疑惑的地方各有不同,有人是网页制作,有人是网页信息爬取,一个萝卜一个坑,今天我就来对网页爬取是出现的状况进行分析,并处理

简单对这两个名词进行介绍吧

在这里插入图片描述
网页源代码:
网页源代码是对一个网页所组成代码的构成,我们打开一个网页
框架源代码
相对来说可以说也是网页源代码,但渲染效果不同,里面信息就相对比网页源代码多。
开发者工具:
是对所有源代码渲染之后的结果,将网页源代码和框架代码合起来渲染给我们,里面结构也相对清晰。

网页源代码是父级网页的代码
网页中有一种节点叫iframe,也就是子Frame,相当于网页的子页面,他的结构和外部网页的结构完全一致,框架源代码就是这个子网页的源代码。

这里我们的爬虫得到的是网页源代码,有时我们用requests提取网页源代码时,发现我们所需要提取的数据里面没有,不要慌,你所需要的信息在网页的框架源代码中,这也算是一钟反爬机制,我们可以对框架源代码进行爬取。

框架源代码可以右键查看,然后寻找相对于的 url
或者可以利用开发者工具进行抓包,处理

猜你喜欢

转载自blog.csdn.net/weixin_45837168/article/details/105113688