正则表达式匹配
题目描述:
JOBDU最近来了一个新员工Fish,每天早晨总是会拿着一本英文杂志,写些句子在本子上。同事Cat对Fish写的内容颇感兴趣,有一天他向Fish借来翻看,但却读不懂它的意思。例如,“student. a am I”。后来才意识到,这家伙原来把句子单词的顺序翻转了,正确的句子应该是“I am a student.”。Cat对一一的翻转这些单词顺序可不在行,你能帮助他么?
思路:
我们首先必须对正则表达式匹配这个概念了解清楚,此处我对它的理解还比较基础,附上链接:
https://baike.baidu.com/item/%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F/1700215
接下来我们讨论针对这个题目的思路:
首先,考虑特殊情况:
1>两个字符串都为空,返回true
2>当第一个字符串不空,而第二个字符串空了,返回false(因为这样,就无法
匹配成功了,而如果第一个字符串空了,第二个字符串非空,还是可能匹配成
功的,比如第二个字符串是“a*a*a*a*”,由于‘*’之前的元素可以出现0次,
所以有可能匹配成功)
之后就开始匹配第一个字符,这里有两种可能:匹配成功或匹配失败。但考虑到pattern
下一个字符可能是‘*’, 这里我们分两种情况讨论:pattern下一个字符为‘*’或
不为‘*’:
1>pattern下一个字符不为‘*’:这种情况比较简单,直接匹配当前字符。如果
匹配成功,继续匹配下一个,pattern和字符串都向后移动一个字符;如果匹配失败,直接返回
false。注意这里的“匹配成功”,除了两个字符相同的情况外,还有一种情况,就是pattern的
当前字符为‘.’,同时str的当前字符不为‘\0’。
2>pattern下一个字符为‘*’时,稍微复杂一些,因为‘*’可以代表0个或多个。
这里把这些情况都考虑到:
a>当‘*’匹配0个字符时,str当前字符不变,pattern当前字符后移两位,
跳过这个‘*’符号;
b>当‘*’匹配1个或多个时,str当前字符移向下一个,pattern当前字符
不变。(这里匹配1个或多个可以看成一种情况,因为:当匹配一个时,
由于字符串str移到了下一个字符,而pattern字符不变;当匹配多于一个字符时,相当于
从str的下一个字符继续开始匹配,pattern向后移动一个字符)
下面是我在牛客网编译测试通过的:
class Solution {
public:
bool match(char* str, char* pattern)
{
if(str==NULL||pattern==NULL)
return false;
return matchCore(str,pattern);
}
bool matchCore(char* str, char* pattern)
{
if(*str=='\0'&&*pattern=='\0')
return true;
if(*str!='\0'&&*pattern=='\0')
return false;
if(*(pattern+1)=='*')//pattern下一个字符是‘*’
{
if(*pattern==*str||(*pattern=='.'&&*str!='\0'))//是‘*’,并且匹配
/*
matchCore(str,pattern+2):模式串未匹配
matchCore(str+1,pattern):模式串已经匹配成功,尝试匹配下一个字符串
matchCore(str+1,pattern+2):模式串已经成功匹配,并且不匹配下一个字符串内容 */
return matchCore(str+1,pattern)||matchCore(str,pattern+2)||match(str+1, pattern+2);
else
return matchCore(str,pattern+2);//是‘*’,但是不匹配,模式串向后移动两个字符
}
else if(*str==*pattern||(*pattern=='.'&&*str!='\0'))//pattern的下一个不是‘*’,如果匹配,字符串和模式串都向后移动一个字符
return matchCore(str+1,pattern+1);
return false;
}
};