Jsoup对象

其他 2020-03-03 22:17:31 阅读次数: 0

1.Jsoup：工具类，解析HTML，XML文档，加载文档进内存，获取dom树-->返回Document文档对象

parse（）：解析HTML和XML，返回Documet对象

　　重载方法

parse(File in, String charsetName)：解析HTML或XML文件的。（也就是需要存在一个File对象，物理文件）
- 常用于XML
parse(String html)：解析HTML或XML的字符串（字符串就是，HTML和XML的内容）
- 不常用
parse(URL url, int timeoutMillis)：通过网络路径获取指定的HTML或者XML的文档对象
- timeoutMillis超时时间
- 获取的路径就是对应的HTML文档，这个HTML文档只不过是在浏览器上被解析成用户看到的界面。真实的数据还是代码
- 常用于HTML爬虫程序
- 例如比价网：慢慢买

2. Documet：文档对象=内存中DOM树

主要用来获取Element对象（document继承了node的下的element对象，能获取任意的Element对象）

getElementById(String id)：根据id属性值，获取唯一的element对象
getElementsByTag(String tagName)：根据标签名称，获取元素对象集合
getElementsByAttribute(String key)：根据属性名称，获取元素对象集合
getElementsByAttributeValue(String key, String value)：根据属性名称和属性值，获取元素对象集合

3.Elements：元素Element对象的集合。可以当做：泛型为Element的ArrayList集合

上面的倒数三个方法）

4.Element：元素对象。获取元素的名称、属性、文本

获取子元素对象（只能获取element对象的子标签）
- getElementById(String id)：根据id属性值，获取唯一的element对象
- getElementsByTag(String tagName)：根据标签名称，获取元素对象集合
- getElementsByAttribute(String key)：根据属性名称，获取元素对象集合
- getElementsByAttributeValue(String key, String value)：根据属性名称和属性值，获取元素对象集合
获取属性值（从node继承过来的方法）
- String attr(String key)：根据属性名称获取属性值，通过传入的属性名称。属性名称不区分大小写
- String写在方法前面表示返回值
获取文本内容
- String text()：获取子标签的纯文本内容
- String html()：获取标签体的所有内容（包扩子标签的标签和文本）

　　

5.Node：节点对象。是上面所有的爹

是Documet和Element的父类

猜你喜欢

转载自www.cnblogs.com/rijiyuelei/p/12404973.html

Jsoup对象

Jsoup 对象的使用

jsoup中对象的使用（Jsoup、Document、Elements、Element 、Node ）

jsoup

W3C Document 与Jsoup Document之间对象互转

Java爬虫：Jsoup利用dom方法遍历Document对象

Jsoup框架

jsoup学习

jsoup 简介

Jsoup 笔记

Jsoup类

JSOUP补全

XML与Jsoup

Jsoup总结

jsoup使用

爬虫Jsoup

jsoup爬虫

jsoup入门

jsoup的使用

Jsoup Demo

Jsoup方法

Jsoup（2）

Jsoup（1）

Jsoup（3）

Jsoup课程：

Jsoup介绍

Jsoup（一）Jsoup详解（官方）

[转]Jsoup（一）Jsoup详解（官方）

java jsoup 网络爬虫 jsoup解析html

Jsoup详解，Jsoup.connect(“url”).get()

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)