剑指Offer系列(java版,详细解析)19.正则表达式匹配

题目描述

剑指 Offer 19. 正则表达式匹配

难度困难

请实现一个函数用来匹配包含'. ''*'的正则表达式。模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(含0次)。在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a""ab*ac*a"匹配,但与"aa.a""ab*a"均不匹配。

示例 1:

输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。

示例 2:

输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。

示例 3:

输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。

示例 4:

输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。

示例 5:

输入:
s = "mississippi"
p = "mis*is*p*."
输出: false
  • s 可能为空,且只包含从 a-z 的小写字母。
  • p 可能为空,且只包含从 a-z 的小写字母以及字符 .*,无连续的 '*'

注意:本题与主站 10 题相同:https://leetcode-cn.com/problems/regular-expression-matching/

测试用例

  • 功能测试(模式字符串里包含普通字符、‘.’、‘*’;模式字符串和输入字符串匹配/不匹配;“.*”这个组合真的是吃屎)
  • 特殊输入测试(输入字符串和模式字符是null、空字符串)

题目考点

  • 考察应聘者对字符串的编程能力
  • 考察应聘者对正则表达式的理解
  • 考察应聘者思维的全面性。在应聘者写完代码之后,面试官会要求他测试自己的代码,这个时候应聘者要充分考虑普通字符、‘.’、‘*’三者的排列组合,尽量完备地想出所有可能的测试用例。

解题思路

用递归的思想解决,对于一次判断有以下情况:

  • 当模式中的第二个字符不是“*”时:

    • 如果字符串第一个字符和模式中的第一个字符相匹配,那么字符串和模式都后移一个字符,然后匹配剩余的。
    • 如果字符串第一个字符和模式中的第一个字符相不匹配,直接返回false。
  • 当模式中的第二个字符是“*”时:

    • 如果字符串第一个字符跟模式第一个字符不匹配,则模式后移2个字符,继续匹配。
    • 如果字符串第一个字符跟模式第一个字符匹配,可以有3种匹配方式:
      • 模式后移2字符,相当于x*被忽略;
      • 字符串后移1字符,模式后移2字符;
      • 字符串后移1字符,模式不变,即继续匹配字符下一位,因为*可以匹配多位;

参考解题

/**
 * 正则表达式匹配
 *

 */
public class Solution {
    
    
    /**
     * 正则表达式匹配
     * (递归)
     *
     * @param str
     * @param pattern
     * @return
     */
    public boolean match(char[] str, char[] pattern) {
    
    
        if (str == null || pattern == null) {
    
    
            return false;
        }
        return matchCore(str, pattern, 0, 0);

    }

    /**
     * 正则表达式匹配分步
     *
     * @param str     字符串
     * @param pattern 模式
     * @param i       str的下标
     * @param j       patter的下标
     * @return
     */
    public boolean matchCore(char[] str, char[] pattern, int i, int j) {
    
    
        // 终止条件
        if (i == str.length && j == pattern.length) {
    
    
            return true;
        }
        // 当模式不足以配置字符串时
        if (i < str.length && j == pattern.length) {
    
    
            return false;
        }
        // 当模式中的第二个字符是“*”时:
        if (j + 1 < pattern.length && pattern[j + 1] == '*') {
    
    
            // 如果字符串第一个字符跟模式第一个字符匹配,可以有3种匹配方式
            if (i != str.length && pattern[j] == str[i] || (pattern[j] == '.' && i != str.length)) {
    
    
                return
                        // 字符串后移1字符,模式后移2字符
                        matchCore(str, pattern, i + 1, j + 2)
                                // 字符串后移1字符,模式不变,即继续匹配字符下一位,因为*可以匹配多位
                                || matchCore(str, pattern, i + 1, j)
                                // 模式后移2字符,相当于x*被忽略
                                || matchCore(str, pattern, i, j + 2);
            } else {
    
    
                return matchCore(str, pattern, i, j + 2);
            }

        }
        // 如果字符串第一个字符和模式中的第一个字符相匹配,那么字符串和模式都后移一个字符,然后匹配剩余的
        if ((i != str.length && str[i] == pattern[j]) || (pattern[j] == '.' && i != str.length)) {
    
    
            return matchCore(str, pattern, i + 1, j + 1);
        }
        // 如果字符串第一个字符和模式中的第一个字符相不匹配,直接返回false
        return false;
    }

}

补充

动态规划

class Solution {
    
    
    public boolean isMatch(String s, String p) {
    
    
        int m = s.length() + 1, n = p.length() + 1;
        boolean[][] dp = new boolean[m][n];
        dp[0][0] = true;
        for(int j = 2; j < n; j += 2)
            dp[0][j] = dp[0][j - 2] && p.charAt(j - 1) == '*';
        for(int i = 1; i < m; i++) {
    
    
            for(int j = 1; j < n; j++) {
    
    
                dp[i][j] = p.charAt(j - 1) == '*' ?
                    dp[i][j - 2] || dp[i - 1][j] && (s.charAt(i - 1) == p.charAt(j - 2) || p.charAt(j - 2) == '.') :
                    dp[i - 1][j - 1] && (p.charAt(j - 1) == '.' || s.charAt(i - 1) == p.charAt(j - 1));
            }
        }
        return dp[m - 1][n - 1];
    }
}

清晰版本

class Solution {
    
    
    public boolean isMatch(String s, String p) {
    
    
        int m = s.length() + 1, n = p.length() + 1;
        boolean[][] dp = new boolean[m][n];
        dp[0][0] = true;
        // 初始化首行
        for(int j = 2; j < n; j += 2)
            dp[0][j] = dp[0][j - 2] && p.charAt(j - 1) == '*';
        // 状态转移
        for(int i = 1; i < m; i++) {
    
    
            for(int j = 1; j < n; j++) {
    
    
                if(p.charAt(j - 1) == '*') {
    
    
                    if(dp[i][j - 2]) dp[i][j] = true;                                            // 1.
                    else if(dp[i - 1][j] && s.charAt(i - 1) == p.charAt(j - 2)) dp[i][j] = true; // 2.
                    else if(dp[i - 1][j] && p.charAt(j - 2) == '.') dp[i][j] = true;             // 3.
                } else {
    
    
                    if(dp[i - 1][j - 1] && s.charAt(i - 1) == p.charAt(j - 1)) dp[i][j] = true;  // 1.
                    else if(dp[i - 1][j - 1] && p.charAt(j - 1) == '.') dp[i][j] = true;         // 2.
                }
            }
        }
        return dp[m - 1][n - 1];
    }
}

猜你喜欢

转载自blog.csdn.net/weixin_43314519/article/details/114784166