使用Jsoup对HTML进行解析 - 代码天地

使用Jsoup对HTML进行解析

企业开发 2018-05-12 09:48:29 阅读次数: 2

http://blog.csdn.net/a2bgeek/article/details/7860954
貌似解析HTML的工具名字都是XXsoup，比如python的beautifulsoup，这里介绍一下java的Jsoup。我这里只说我使用的感受。
Jsoup可以解析服务器上的、本地的HTML文件，将里面的标签过滤掉，得到有用的内容，。
比如只需要<title>标签的内容，

解析本地的：需要把文件放到IO流中

Document doc = Jsoup.parse(inputStream, "UTF-8", "http://www.google.com.hk/");  
String title = doc.title();

解析服务器上的：

Document doc = Jsoup.connect("http://www.XXX.com/").get();   
String title = doc.title();

再比如需要整个<body>中的内容，

Document doc = Jsoup.parse(inputStream, "UTF-8", "http://www.google.com.hk/");  
Element body = doc.body();  
String text = body.text();

下面的的链接是Jsoup的帮助文档：
http://jsoup.org/apidocs/
下面是官方的SDK：
Jsoup1.6.3
还有一个我学习Jsoup的链接：
http://www.oschina.net/code/tag/jsoup

猜你喜欢

转载自panyongzheng.iteye.com/blog/1948941

使用Jsoup对HTML进行解析

使用Jsoup解析html

使用 jsoup 解析HTML

使用 jsoup 对 HTML 文档进行解析和操作

使用Jsoup解析HTML进行数据收集

使用JSoup解析HTML文件

使用JSOUP解析HTML文档

JAVA爬虫HTML解析工具——jsoup的使用

SpringBoot、Java 使用 Jsoup 解析 HTML 页面

JSoup 解析html

jsoup——java解析html

html解析利器－JSOUP

Jsoup解析Html教程

Jsoup解析HTML

Jsoup解析HTML片段

Jsoup解析完整的HTML

jsoup解析html 用法

java jsoup 网络爬虫 jsoup解析html

使用Jsoup解析出html中的img元素

Android 使用Jsoup解析html+下载图片

Java爬虫系列三：使用Jsoup解析HTML

使用Jsoup 过滤HTML

Jsoup解析html及body片断

HTML 解析器 jsoup

jsoup解析html的简单demo

Jsoup解析HTML并下载图片

jsoup解析html简单总结

JSoup HTML解析器

jsoup解析html 爬虫规则

Jsoup解析网页html文档

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)