LeetCode 392. 判断子序列

题目描述

给定字符串 s 和 t ，判断 s 是否为 t 的子序列。

你可以认为 s 和 t 中仅包含英文小写字母。字符串 t 可能会很长（长度 ~= 500,000），而 s 是个短字符串（长度 <=100）。

字符串的一个子序列是原始字符串删除一些（也可以不删除）字符而不改变剩余字符相对位置形成的新字符串。（例如，"ace"是"abcde"的一个子序列，而"aec"不是）。

示例 1:
s = "abc", t = "ahbgdc"

返回 true.

示例 2:
s = "axc", t = "ahbgdc"

返回 false.

后续挑战 :

如果有大量输入的 S，称作S1, S2, ... , Sk 其中 k >= 10亿，你需要依次检查它们是否为 T 的子序列。在这种情况下，你会怎样改变代码？

致谢:

特别感谢 @pbrother 添加此问题并且创建所有测试用例。

问题分析 1

定义两个指针，一个指向字符串s的开头，一个指向字符串t的开头。如果两个字符相同，那么两个指针都向后走一步，如果不相同，那么指向字符串t的指针向后走一步。当两个指针至少有其中一个走到字符串末尾时退出循环，这时看指向字符串s的指针是否已经到达末尾，是返回true，不是返回false。

代码实现 1

class Solution {
public:
    bool isSubsequence(string s, string t) {
        int i = 0, j = 0;
        while(i < s.size() && j < t.size()){
            if(s[i] == t[j]){
                i++;
                j++;
            }
            else{
                j++;
            }
        }
        return i == s.size();
    }
};

问题分析 2

follow up，当字符串t不变，s有大量的情况。这时我们创建一个<char, vector<int>>的哈希map，将字符串t中的每一个字符及其出现的位置保存到哈希map中，同一个字符出现的多次位置保存在该字符对应的数组中。然后遍历字符串s，在哈希map中找到当前遍历的字符在pre后第一次出现的位置，如果没找到则返回false；如果找到了位置，则将pre更新为该位置。当遍历字符串s结束后，仍未返回false，那么说明s是t的子序列，返回true。

代码实现 2

class Solution {
public:
    bool isSubsequence(string s, string t) {
        int pre = -1;
        unordered_map<char, vector<int>> umap;
        for(int i = 0; i < t.size(); i++){
            umap[t[i]].push_back(i);
        }
        for(char c : s){
            auto it = upper_bound(umap[c].begin(), umap[c].end(), pre);
            if(it == umap[c].end())
                return false;
            pre = *it;
        }    
        return true;
    }
};