html解析利器-JSOUP

因项目需求,需要跨项目调取别的项目的接口。
尝试着用java.net包里的URLConnection获取连接,然后用io包里的BufferedReader 读取调用外部项目接口后返回的网址的内容。
代码形如:
StringBuilder ans = new StringBuilder();
URL u= new URL(url);
URLConnection con = u.openConnection();
BufferedReader in = new BufferedReader(new InputStreamReader(
                                        con.getInputStream()));
String inputLine = null;
while ( (inputLine = in.readLine()) != null) {
          ans.append(inputLine);
        }
in.close();

但是由于外部项目里的接口所返回的数据是直接通过response.getWriter().write()进行展示的。且该方法可能经过跳转或其它处理,故以上代码无法获得任何内容。
遂网上搜索方法,终于发现JSOUP这个工具。
百度对其的解释是:
jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
看着很炫酷,实际使用一下才知道到底有没有用。遂有如下代码:
Document doc=Jsoup.connect(url).get();
String str=doc.text();
“叮”,居然读出来了!
不管URL有没有跳转,JSOUP都能够完美得读到其内容。实是令人欣喜。
因时间关系,JSOUP其它功能暂未探索,故先将此文贴出,以供日后查阅。

猜你喜欢

转载自leozam.iteye.com/blog/2303931