题目描述
剑指 Offer 19. 正则表达式匹配
难度困难
请实现一个函数用来匹配包含'. '
和'*'
的正则表达式。模式中的字符'.'
表示任意一个字符,而'*'
表示它前面的字符可以出现任意次(含0次)。在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"
与模式"a.a"
和"ab*ac*a"
匹配,但与"aa.a"
和"ab*a"
均不匹配。
示例 1:
输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。
示例 2:
输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
示例 3:
输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。
示例 4:
输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
示例 5:
输入:
s = "mississippi"
p = "mis*is*p*."
输出: false
s
可能为空,且只包含从a-z
的小写字母。p
可能为空,且只包含从a-z
的小写字母以及字符.
和*
,无连续的'*'
。
注意:本题与主站 10 题相同:https://leetcode-cn.com/problems/regular-expression-matching/
测试用例
- 功能测试(模式字符串里包含普通字符、‘.’、‘*’;模式字符串和输入字符串匹配/不匹配;“.*”这个组合真的是吃屎)
- 特殊输入测试(输入字符串和模式字符是null、空字符串)
题目考点
- 考察应聘者对字符串的编程能力
- 考察应聘者对正则表达式的理解
- 考察应聘者思维的全面性。在应聘者写完代码之后,面试官会要求他测试自己的代码,这个时候应聘者要充分考虑普通字符、‘.’、‘*’三者的排列组合,尽量完备地想出所有可能的测试用例。
解题思路
用递归的思想解决,对于一次判断有以下情况:
-
当模式中的第二个字符不是“*”时:
- 如果字符串第一个字符和模式中的第一个字符相匹配,那么字符串和模式都后移一个字符,然后匹配剩余的。
- 如果字符串第一个字符和模式中的第一个字符相不匹配,直接返回false。
-
当模式中的第二个字符是“*”时:
扫描二维码关注公众号,回复: 12898629 查看本文章- 如果字符串第一个字符跟模式第一个字符不匹配,则模式后移2个字符,继续匹配。
- 如果字符串第一个字符跟模式第一个字符匹配,可以有3种匹配方式:
- 模式后移2字符,相当于x*被忽略;
- 字符串后移1字符,模式后移2字符;
- 字符串后移1字符,模式不变,即继续匹配字符下一位,因为*可以匹配多位;
参考解题
/**
* 正则表达式匹配
*
*/
public class Solution {
/**
* 正则表达式匹配
* (递归)
*
* @param str
* @param pattern
* @return
*/
public boolean match(char[] str, char[] pattern) {
if (str == null || pattern == null) {
return false;
}
return matchCore(str, pattern, 0, 0);
}
/**
* 正则表达式匹配分步
*
* @param str 字符串
* @param pattern 模式
* @param i str的下标
* @param j patter的下标
* @return
*/
public boolean matchCore(char[] str, char[] pattern, int i, int j) {
// 终止条件
if (i == str.length && j == pattern.length) {
return true;
}
// 当模式不足以配置字符串时
if (i < str.length && j == pattern.length) {
return false;
}
// 当模式中的第二个字符是“*”时:
if (j + 1 < pattern.length && pattern[j + 1] == '*') {
// 如果字符串第一个字符跟模式第一个字符匹配,可以有3种匹配方式
if (i != str.length && pattern[j] == str[i] || (pattern[j] == '.' && i != str.length)) {
return
// 字符串后移1字符,模式后移2字符
matchCore(str, pattern, i + 1, j + 2)
// 字符串后移1字符,模式不变,即继续匹配字符下一位,因为*可以匹配多位
|| matchCore(str, pattern, i + 1, j)
// 模式后移2字符,相当于x*被忽略
|| matchCore(str, pattern, i, j + 2);
} else {
return matchCore(str, pattern, i, j + 2);
}
}
// 如果字符串第一个字符和模式中的第一个字符相匹配,那么字符串和模式都后移一个字符,然后匹配剩余的
if ((i != str.length && str[i] == pattern[j]) || (pattern[j] == '.' && i != str.length)) {
return matchCore(str, pattern, i + 1, j + 1);
}
// 如果字符串第一个字符和模式中的第一个字符相不匹配,直接返回false
return false;
}
}
补充
动态规划
class Solution {
public boolean isMatch(String s, String p) {
int m = s.length() + 1, n = p.length() + 1;
boolean[][] dp = new boolean[m][n];
dp[0][0] = true;
for(int j = 2; j < n; j += 2)
dp[0][j] = dp[0][j - 2] && p.charAt(j - 1) == '*';
for(int i = 1; i < m; i++) {
for(int j = 1; j < n; j++) {
dp[i][j] = p.charAt(j - 1) == '*' ?
dp[i][j - 2] || dp[i - 1][j] && (s.charAt(i - 1) == p.charAt(j - 2) || p.charAt(j - 2) == '.') :
dp[i - 1][j - 1] && (p.charAt(j - 1) == '.' || s.charAt(i - 1) == p.charAt(j - 1));
}
}
return dp[m - 1][n - 1];
}
}
清晰版本
class Solution {
public boolean isMatch(String s, String p) {
int m = s.length() + 1, n = p.length() + 1;
boolean[][] dp = new boolean[m][n];
dp[0][0] = true;
// 初始化首行
for(int j = 2; j < n; j += 2)
dp[0][j] = dp[0][j - 2] && p.charAt(j - 1) == '*';
// 状态转移
for(int i = 1; i < m; i++) {
for(int j = 1; j < n; j++) {
if(p.charAt(j - 1) == '*') {
if(dp[i][j - 2]) dp[i][j] = true; // 1.
else if(dp[i - 1][j] && s.charAt(i - 1) == p.charAt(j - 2)) dp[i][j] = true; // 2.
else if(dp[i - 1][j] && p.charAt(j - 2) == '.') dp[i][j] = true; // 3.
} else {
if(dp[i - 1][j - 1] && s.charAt(i - 1) == p.charAt(j - 1)) dp[i][j] = true; // 1.
else if(dp[i - 1][j - 1] && p.charAt(j - 1) == '.') dp[i][j] = true; // 2.
}
}
}
return dp[m - 1][n - 1];
}
}