python3网络爬虫——day1-2

网页基础

网页组成可以分为三个部分:HTML、CSS和JavaScript。 HTML定义了网页的内容和结构,CSS描述了网页的布局,JavaScript定义了网页的行为。

HTML: Hyper Text Markup Language,超文本标记语言。网页包括文字、按钮、图片和视频等各种复杂的元素,其基础架构就是HTML。不同类型的数据通过不同类型的标签来表示,它们之间的不通过布局标签div嵌套组合而成。各种标签通过不同的排列和嵌套才能形成网页的框架。

CSS:Cascading Style Sheets,层叠样式表。CSS是目前唯一的网页页面排版样式标准。在网页中,一般会统一定义整个网页的样式规则,并写入CSS文件中(其后缀为css)。在HTML中,只需要link标签即可引入写好的CSS文件。

JavaScript:简称JS,是一种脚本语言。HTML和CSS配合使用,提供给用户的知识一种静态信息,缺乏交互性。JavaScript 实现了实时、动态、交互的页面功能。JavaScript通常以单独的文件形式加载,后缀名为js,在HTML 中通过script标签即可引入。

网页结构

W3C文档对象模型(DOM,Document Object Model)是中立于平台和语言的接口,它允许程序和脚本动态的访问和更新文档的内容、结构和样式。

W3C DOM标准被分为三个部分:

1、核心DOM:针对任何结构化文档的标准模型;

2、XML DOM:针对XML文档的标准模型;

3、HTML DOM:针对HTML文档的标准模型

HTML DOM将HTML文档视作树结构,这种结构成为节点树。

选择器

在CSS中,我们使用CSS选择器来定位节点。最常用的三种方式:#开头代表选择id,(.)开头代表选择class,根据标签名筛选 。CSS选择器支持嵌套选择。

猜你喜欢

转载自blog.csdn.net/weixin_41124748/article/details/82863190
今日推荐