jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
例如:
pom.xml引入:
<!-- HTML解析器--> <dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.10.3</version> </dependency>
Java:
List<String> imgList = null; Document document = Jsoup.connect(url).get(); Elements elements = document.getElementsByTag("img"); for (Element element : elements) { imgList.add(element.attr("src")); }