Java去除基本的HTML标签

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/jiaonizuoren/article/details/83898188
// 去除基本的标签
    public static String replaceHtmlBasicTag(String content, String replacement) {
        String rtn = content;
        if (StringUtils.isNotBlank(rtn) && replacement != null) {
            Matcher htmlTag = Pattern.compile("<script [^>]*>(.*?)</script>",
                    Pattern.DOTALL | Pattern.CASE_INSENSITIVE | Pattern.COMMENTS).matcher(rtn);
            if (htmlTag.find()) {
                rtn = htmlTag.replaceAll(replacement);
            }
            htmlTag = Pattern.compile("<style [^>]*>(.*?)</style>",
                    Pattern.DOTALL | Pattern.CASE_INSENSITIVE | Pattern.COMMENTS).matcher(rtn);
            if (htmlTag.find()) {
                rtn = htmlTag.replaceAll(replacement);
            }
            htmlTag = Pattern.compile("<link [^>]*>(.*?)</link>",
                    Pattern.DOTALL | Pattern.CASE_INSENSITIVE | Pattern.COMMENTS).matcher(rtn);
            if (htmlTag.find()) {
                rtn = htmlTag.replaceAll(replacement);
            }
            htmlTag = Pattern.compile("<([^>]*)>", Pattern.DOTALL | Pattern.CASE_INSENSITIVE).matcher(rtn);
            if (htmlTag.find()) {
                rtn = htmlTag.replaceAll(replacement);
            }
            rtn = rtn.replaceAll(" +", " ").replaceAll("\\t+", " ").replaceAll(" +", " ").replaceAll("(&nbsp;){1,}", " ").replace("|0", "");
            if(rtn.contains("您的浏览器不支持video标签。")){
                rtn = rtn.replaceAll("您的浏览器不支持video标签。", "");
            }
            if (rtn.contains("您不支持音频播放")) {
                rtn = rtn.replaceAll("您不支持音频播放", "");
            }
            if (rtn.contains("您不支持视频播放")) {
                rtn = rtn.replaceAll("您不支持视频播放", "");
            }
            if (rtn.contains("您的浏览器不支持此视频格式")) {
                rtn = rtn.replaceAll("您的浏览器不支持此视频格式", "");
            }
        }
        return rtn;
    }

猜你喜欢

转载自blog.csdn.net/jiaonizuoren/article/details/83898188