使用Pattern、Matcher来实现搜索高亮显示

需求很简单,做一个搜索功能,要求搜索结果高亮显示。
1、最简单直接的方法,使用string的indexOf方法,来获取关键字的为准,然后做高亮处理。但是这样如果文本里多次出现关键字,就不太好弄了;
2、使用正则表达式判断:
使用正则表达式当然是一个好办法,但是很少人能直接写出正则表达式,那怎么办呢?别急Java里自带了封装好的类来帮助我们实现,它就是Pattern和Matcher!
具体用法大家可以自己去百度Google一下,这里不详细介绍了,只说一下我在实现高亮的时候遇到的问题以及解决方法。
下面下把代码供出来:

public static SpannableStringBuilder highlight(String text, String target) {

        SpannableStringBuilder spannable = new SpannableStringBuilder(text);
        CharacterStyle span = null;

        Pattern p = Pattern.compile(target,Pattern.CASE_INSENSITIVE);
        Matcher m = p.matcher(text);
        while (m.find()) {
            span = new ForegroundColorSpan(Color.RED);
            spannable.setSpan(span, m.start(), m.end(),
                    Spannable.SPAN_EXCLUSIVE_EXCLUSIVE);
        }
        return spannable;
    }

主要就是通过SpannableStringBuilder来显示高亮,然后通过Pattern和Matcher来解析。
其中Pattern.compile(target,Pattern.CASE_INSENSITIVE); 表示不区分大小写。
本来挺好的一个功能,突然测试人员提了一个崩溃的bug,在输入框中输入“+”的时候会导致app crash。这是什么情况?自己试了一下,发现报错信息如下:


Caused by: java.util.regex.PatternSyntaxException: Syntax error in regexp pattern near index 1:
E/AndroidRuntime(17429):+
E/AndroidRuntime(17429): ^
E/AndroidRuntime(17429): at java.util.regex.Pattern.compileImpl(Native Method)
E/AndroidRuntime(17429): at java.util.regex.Pattern.compile(Pattern.java:400)

虽然知道是特殊符号导致的,但是经过测试发现并不是所有的特殊符号都会出现这个问题。
那有哪些特殊符号会导致呢?

正则表达式中有一类叫做“元字符(meta-character)”的特殊符号,它们并不匹配自身对应的字符,而具有其他的含义。比如脱字符『^』表示“定位到字符串/行的开头”,加号『+』表示“之前的元素重现1次以上。如果需要匹配这些字符本身,需要用反斜线来转义,匹配『^』就应该用\^,匹配『+』就应该用+。

看起来有点麻烦,但这样的元字符并不多:^$()*+?.[{|

这就好办了,最简单粗暴的办法就是:

final static String PATTERN_SYMBOL = "^$()*+?.[\\{|";
if (PATTERN_SYMBOL.contains(target)){
    target = "\\"+target;//对正则表达式保留符号进行转义
}

对于这些特殊符号做转义。
虽然这样可以实现,但是总觉得不够“优雅”,有没有更方便、更优雅的解决办法呢?答案是肯定的!
还记得在创建Pattern 时的flag——Pattern.CASE_INSENSITIVE,既然能不区分大小写,那能不能转义元字符呢?
点进Pattern类,发现里面定义了好多静态flag,其中有一个

 /**
     * This constant specifies that the whole {@code Pattern} is to be taken
     * literally, that is, all meta characters lose their meanings.
     */
public static final int LITERAL = 0x10;

注释大致意思就是说 所有字符都是按照字面意思来,所有的元字符都失去了它们的意义。那不正是我们想要的吗?
试了一下,果然好用!
当然有人还想不区分大小写,又要使用元字符,那怎么办呢?

Pattern p = Pattern.compile(target,Pattern.LITERAL|Pattern.CASE_INSENSITIVE);

这么写,搞定!

参考文档:
http://www.cnblogs.com/ajianbeyourself/p/5709567.html

发布了61 篇原创文章 · 获赞 9 · 访问量 11万+

猜你喜欢

转载自blog.csdn.net/fly_yuge/article/details/52588098
今日推荐