html解析利器－JSOUP - 代码天地

html解析利器－JSOUP

编程语言 2018-05-12 19:48:23 阅读次数: 0

因项目需求，需要跨项目调取别的项目的接口。
尝试着用java.net包里的URLConnection获取连接，然后用io包里的BufferedReader 读取调用外部项目接口后返回的网址的内容。
代码形如：

StringBuilder ans = new StringBuilder();
URL u= new URL(url);
URLConnection con = u.openConnection();
BufferedReader in = new BufferedReader(new InputStreamReader(
                                        con.getInputStream()));
String inputLine = null;
while ( (inputLine = in.readLine()) != null) {
          ans.append(inputLine);
        }
in.close();

但是由于外部项目里的接口所返回的数据是直接通过response.getWriter().write()进行展示的。且该方法可能经过跳转或其它处理，故以上代码无法获得任何内容。
遂网上搜索方法，终于发现JSOUP这个工具。
百度对其的解释是：
jsoup 是一款Java 的HTML解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。
看着很炫酷，实际使用一下才知道到底有没有用。遂有如下代码：
Document doc=Jsoup.connect(url).get();
String str=doc.text();
“叮”，居然读出来了！
不管URL有没有跳转，JSOUP都能够完美得读到其内容。实是令人欣喜。
因时间关系，JSOUP其它功能暂未探索，故先将此文贴出，以供日后查阅。

猜你喜欢

转载自leozam.iteye.com/blog/2303931

html解析利器－JSOUP

JSoup 解析html

jsoup——java解析html

Jsoup解析Html教程

Jsoup解析HTML

使用Jsoup解析html

使用 jsoup 解析HTML

Jsoup解析HTML片段

Jsoup解析完整的HTML

jsoup解析html 用法

java jsoup 网络爬虫 jsoup解析html

Jsoup解析html及body片断

使用Jsoup对HTML进行解析

HTML 解析器 jsoup

jsoup解析html的简单demo

使用JSoup解析HTML文件

Jsoup解析HTML并下载图片

jsoup解析html简单总结

JSoup HTML解析器

使用JSOUP解析HTML文档

jsoup解析html 爬虫规则

Jsoup解析网页html文档

Jsoup解析Html获取内容

Jsoup解析HTML时特殊标签的解析

解析网页利器组合（正则、jsoup、beanshell、dozer）资源

Jsoup解析HTML实例及文档方法详解

JSoup HTML文件解析用法详解

解析HTML工具Jsoup的封装类

jsoup 和nekohtml，htmlparser解析html

java-jsoup html解析器

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)