给定一个字符串 S,找出 S 中不同的非空回文子序列个数,并返回该数字与 10^9 + 7 的模。
通过从 S 中删除 0 个或多个字符来获得子字符序列。
如果一个字符序列与它反转后的字符序列一致,那么它是回文字符序列。
如果对于某个 i,A_i != B_i,那么 A_1, A_2, … 和 B_1, B_2, … 这两个字符序列是不同的。
示例 1:
输入:
S = 'bccb'
输出:6
解释:
6 个不同的非空回文子字符序列分别为:'b', 'c', 'bb', 'cc', 'bcb', 'bccb'。
注意:'bcb' 虽然出现两次但仅计数一次。
示例 2:
输入:
S = 'abcdabcdabcdabcdabcdabcdabcdabcddcbadcbadcbadcbadcbadcbadcbadcba'
输出:104860361
解释:
共有 3104860382 个不同的非空回文子字符序列,对 10^9 + 7 取模为 104860361。
提示:
字符串 S 的长度将在[1, 1000]范围内。
每个字符 S[i] 将会是集合 {'a', 'b', 'c', 'd'} 中的某一个。
思路分析: 这道题我们使用动态规划进行处理。dp[i][j]表示的S[i, j]这段字符串中不同的回文子序列个数。
状态转移方程:
如果 S[i] == S[j],这时我们需要判断[i, j]这一段中有多少字符与S[i]不相等
如果中间没有和S[i]相同的字母,例如"aba"这种情况,dp[i][j] = dp[i + 1][j - 1] * 2 + 2;(dp[i][j] = dp[i + 1][j - 1] * 2 代表的dp[i + 1[j - 1]这一段可以独立存在,也可在外层包裹S[i],S[j],所有需要x2,而2是代表“aa”和“a”)
如果中间只有一个和S[i]相同的字母,就是"aaa"这种情况,dp[i][j] = dp[i + 1][j - 1] * 2 + 1;(x2与上面情况相同,加一单独计算"aa",而“a”在dp[i + 1][j - 1] 中计算过了)
否则中间至少有两个和S[i]相同的字母,就是"aabaa"这种情况,dp[i][j] = dp[i + 1][j - 1] * 2 - dp[left + 1][right - 1];(left、right请见代码注释,dp[left + 1][right - 1]这一段重复计算了)
否则dp[i][j] = dp[i][j - 1] + dp[i + 1][j] - dp[i + 1][j - 1];
class Solution {
public:
int countPalindromicSubsequences(string S) {
int strSize = S.size(), M = 1e9 + 7;
//dp[i][j]表示的S[i, j]这段字符串中不同的回文子序列个数
vector<vector<int>> dp(strSize, vector<int>(strSize, 0));
//初始化,当个长度的字符串也是一个结果
for (int i = 0; i < strSize; ++i) {
dp[i][i] = 1;
}
//开始动态规划
for (int i = strSize - 2; i >= 0; --i){
for (int j = i + 1; j < strSize; ++j){
//上面的两层for循环用于穷举区间[i, j],i用于确定区间的起点,j确定区间的尾端,并且区间的长度都是由2逐渐增大
if (S[i] == S[j]) {
//left用于寻找与S[i]相同的左端第一个下标,right用于寻找与S[i]相同的右端第一个下标
int left = i + 1, right = j - 1;
while (left <= right && S[left] != S[i]) {
++left;
}
while (left <= right && S[right] != S[i]) {
--right;
}
if (left > right) {
//中间没有和S[i]相同的字母,例如"aba"这种情况
//其中dp[i + 1][j - 1]是中间部分的回文子序列个数,因为中间的所有子序列可以单独存在,也可以再外面包裹上字母a,所以是成对出现的,要乘2。
//加2是统计外层的"a"和"aa"
dp[i][j] = dp[i + 1][j - 1] * 2 + 2;
}
else if (left == right) {
//中间只有一个和S[i]相同的字母,就是"aaa"这种情况,
//其中乘2的部分跟上面的原因相同,
//加1的原因是单个字母"a"的情况已经在中间部分算过了,外层就只能再加上个"aa"了。
dp[i][j] = dp[i + 1][j - 1] * 2 + 1;
}
else {
//中间至少有两个和S[i]相同的字母,就是"aabaa"这种情况,
//其中乘2的部分跟上面的原因相同,要减去left和right中间部分的子序列个数的原因是其被计算了两遍,要将多余的减掉。
dp[i][j] = dp[i + 1][j - 1] * 2 - dp[left + 1][right - 1];
}
}
else {
//dp[i][j - 1] + dp[i + 1][j]这里计算了dp[i + 1][j - 1]两遍
dp[i][j] = dp[i][j - 1] + dp[i + 1][j] - dp[i + 1][j - 1];
}
dp[i][j] = (dp[i][j] < 0) ? dp[i][j] + M : dp[i][j] % M;
}
}
return dp[0][strSize - 1];
}
};