题目描述
给定字符串 s 和 t ,判断 s 是否为 t 的子序列。
你可以认为 s 和 t 中仅包含英文小写字母。字符串 t 可能会很长(长度 ~= 500,000),而 s 是个短字符串(长度 <=100)。
字符串的一个子序列是原始字符串删除一些(也可以不删除)字符而不改变剩余字符相对位置形成的新字符串。(例如,"ace"
是"abcde"
的一个子序列,而"aec"
不是)。
示例 1:
s = "abc"
, t = "ahbgdc"
返回 true
.
示例 2:
s = "axc"
, t = "ahbgdc"
返回 false
.
后续挑战 :
如果有大量输入的 S,称作S1, S2, ... , Sk 其中 k >= 10亿,你需要依次检查它们是否为 T 的子序列。在这种情况下,你会怎样改变代码?
致谢:
特别感谢 @pbrother 添加此问题并且创建所有测试用例。
问题分析 1
定义两个指针,一个指向字符串s的开头,一个指向字符串t的开头。如果两个字符相同,那么两个指针都向后走一步,如果不相同,那么指向字符串t的指针向后走一步。当两个指针至少有其中一个走到字符串末尾时退出循环,这时看指向字符串s的指针是否已经到达末尾,是返回true,不是返回false。
代码实现 1
class Solution {
public:
bool isSubsequence(string s, string t) {
int i = 0, j = 0;
while(i < s.size() && j < t.size()){
if(s[i] == t[j]){
i++;
j++;
}
else{
j++;
}
}
return i == s.size();
}
};
问题分析 2
follow up,当字符串t不变,s有大量的情况。这时我们创建一个<char, vector<int>>的哈希map,将字符串t中的每一个字符及其出现的位置保存到哈希map中,同一个字符出现的多次位置保存在该字符对应的数组中。然后遍历字符串s,在哈希map中找到当前遍历的字符在pre后第一次出现的位置,如果没找到则返回false;如果找到了位置,则将pre更新为该位置。当遍历字符串s结束后,仍未返回false,那么说明s是t的子序列,返回true。
代码实现 2
class Solution {
public:
bool isSubsequence(string s, string t) {
int pre = -1;
unordered_map<char, vector<int>> umap;
for(int i = 0; i < t.size(); i++){
umap[t[i]].push_back(i);
}
for(char c : s){
auto it = upper_bound(umap[c].begin(), umap[c].end(), pre);
if(it == umap[c].end())
return false;
pre = *it;
}
return true;
}
};