1 问题描述
给定两个字符串(或数字序列)A和B,求一个字符串,使得这个字符串是A和B的最长公共部分(子序列可以不连续)
例如,字符串"sadstory"与"adminsorry"的最长公共子序列为"adsory",长度为6
2 求解
如果用暴力的解法,设字符串A和B的长度分别为n和m,那么对两个字符串中的每个字符,分别有选择和不选两个决策,得到两个子序列后,比较两个子序列又需要O(max(n,m)),这样总的时间复杂度会到O ,无法承受数据大的情况。
2.1 动态规划
dp[i][j]表示字符串A的i号位和字符串B的j号位之前的LCS长度(下标从1开始)
例如d[4][5]表示"sads"和“admin”的LCS长度,可以根据A[i],B[i]情况分为两种决策:
- 1 若A[i] == B[j],则字符串A和字符串B的LCS长度增加1位,即有dp[i][j] = d[i -1][j -1] + 1。
- 如:d[4][6]表示"sads"和“admins”的LCS长度,比较A[4]和B[6],发现两者都是’s’,因此dp[4][6]等于dp[3][5]+1,即为3
- 2 若A[i] != B[j],则字符串A和字符串B的LCS长度无法延长,因此dp[i][j]将会继承dp[i-1][j]和dp[i][j-1]中的较大值,即dp[i][j]=max{dp[i-1][j], dp[i][j-1]}.
- l如:d[3][3]表示"sad"和"adm"的LCS长度,比较A[3]和B[3],发现’d’ 不等于’m’,这样d[3][3]无法在原来的基础上延长,因此继承"sa"与"adm"的LCS、"sad"与"ad"的LCS中的较大值,即"sad"与"ad"的LCS长度2。
由此得状态转移方程:
边界:dp[i][0] = dp[0][j] = 0(0<= i <= n, 0 <= j <=m)
3 实现代码
#include <cstdio>
#include <cstring>
#include <algorithm>
using std::max;
const int MAXN = 100;
char A[MAXN], B[MAXN];
int dp[MAXN][MAXN];
int main(int argc, char const *argv[])
{
int n;
fgets(A + 1, MAXN + 1, stdin);//从A[1]开始存储
fgets(B + 1, MAXN + 1, stdin);
int lenA = strlen(A+1) - 1;//strlen计算出得fgets长度末尾多了一个'\0'
int lenB = strlen(B+1) - 1;
//边界
for (int i = 0; i <= lenA; ++i)
{
dp[i][0] = 0;
}
for (int j = 0; j <= lenB; ++j)
{
dp[0][j] = 0;
}
//状态转移方程
for (int i = 1; i <= lenA; ++i)
{
for (int j = 1; j <= lenB; ++j)
{
if(A[i] == B[j]){
dp[i][j] = dp[i -1][j -1] + 1;
}else{
dp[i][j] = max(dp[i-1][j], dp[i][j-1]);
}
}
}
printf("%d\n", dp[lenA][lenB]);
return 0;
}