Java删除富文本的标签

1、富文本格式是什么?

富文本格式是指用户在富文本框输入的类容,这些内容在保存的时候会将你操作的样式利用代码的形式保存到数据库,从数据库拿出数据的时候,这些代码又会重新转成样式。

2、富文本中除了删除标签获取到文本以外,还有其他的方式能只获取文本吗?

可以的。可以将富文本转成文本!

转文本可以参考笔者的这个博客!https://blog.csdn.net/qq_36138652/article/details/81489060

3、怎么讲文本中的标签删除呢?

可以利用下面这个方法来怼富文本的标签进行删除!

public static String delHTMLTag(String htmlStr) {
        String script = "<script[^>]*?>[\\s\\S]*?<\\/script>";
        String style = "<style[^>]*?>[\\s\\S]*?<\\/style>";
        String html = "<[^>]+>";
        String space = "(\r?\n(\\s*\r?\n)+)";
        String white = "&nbsp;";
        Pattern pScript = Pattern.compile(script, 2);
        Matcher mScript = pScript.matcher(htmlStr);
        htmlStr = mScript.replaceAll("");
        Pattern pStyle = Pattern.compile(style, 2);
        Matcher mStyle = pStyle.matcher(htmlStr);
        htmlStr = mStyle.replaceAll("");
        Pattern pHtml = Pattern.compile(html, 2);
        Matcher mHtml = pHtml.matcher(htmlStr);
        htmlStr = mHtml.replaceAll("");
        Pattern pSpace = Pattern.compile(space, 2);
        Matcher mSpace = pSpace.matcher(htmlStr);
        htmlStr = mSpace.replaceAll("");
        htmlStr = htmlStr.replaceAll(white, "");
        return htmlStr.trim();
    }

猜你喜欢

转载自blog.csdn.net/qq_36138652/article/details/83414472