最长公共子序列(Longest Common Subsequence, LCS )

1 问题描述

给定两个字符串(或数字序列)A和B,求一个字符串,使得这个字符串是A和B的最长公共部分(子序列可以不连续)

例如,字符串"sadstory"与"adminsorry"的最长公共子序列为"adsory",长度为6
在这里插入图片描述

2 求解

如果用暴力的解法,设字符串A和B的长度分别为n和m,那么对两个字符串中的每个字符,分别有选择和不选两个决策,得到两个子序列后,比较两个子序列又需要O(max(n,m)),这样总的时间复杂度会到O ( 2 m + n × m a x ( m , n ) ) (2^{m+n} \times max(m,n)) ,无法承受数据大的情况。

2.1 动态规划

dp[i][j]表示字符串A的i号位和字符串B的j号位之前的LCS长度(下标从1开始)

例如d[4][5]表示"sads"和“admin”的LCS长度,可以根据A[i],B[i]情况分为两种决策:

  • 1 若A[i] == B[j],则字符串A和字符串B的LCS长度增加1位,即有dp[i][j] = d[i -1][j -1] + 1。
    • 如:d[4][6]表示"sads"和“admins”的LCS长度,比较A[4]和B[6],发现两者都是’s’,因此dp[4][6]等于dp[3][5]+1,即为3
  • 2 若A[i] != B[j],则字符串A和字符串B的LCS长度无法延长,因此dp[i][j]将会继承dp[i-1][j]和dp[i][j-1]中的较大值,即dp[i][j]=max{dp[i-1][j], dp[i][j-1]}.
    • l如:d[3][3]表示"sad"和"adm"的LCS长度,比较A[3]和B[3],发现’d’ 不等于’m’,这样d[3][3]无法在原来的基础上延长,因此继承"sa"与"adm"的LCS、"sad"与"ad"的LCS中的较大值,即"sad"与"ad"的LCS长度2。

由此得状态转移方程:
d p [ i ] [ j ] = { d p [ i 1 ] [ j 1 ] , A [ i ] = B [ i ] m a x { d p [ i 1 ] [ j ] , d p [ i ] [ j 1 ] } , A [ i ] ! = B [ i ] dp[i][j]=\left\{ \begin{aligned} dp[i-1][j-1],A[i] = B[i] \\ max\{dp[i-1][j],dp[i][j-1]\},A[i] != B[i] \\ \end{aligned} \right.

边界:dp[i][0] = dp[0][j] = 0(0<= i <= n, 0 <= j <=m)

3 实现代码

#include <cstdio>
#include <cstring>
#include <algorithm>

using std::max;

const int MAXN = 100;
char A[MAXN], B[MAXN];
int dp[MAXN][MAXN];


int main(int argc, char const *argv[])
{
    int n;

    fgets(A + 1, MAXN + 1, stdin);//从A[1]开始存储
    fgets(B + 1, MAXN + 1, stdin);

    int lenA = strlen(A+1) - 1;//strlen计算出得fgets长度末尾多了一个'\0'
    int lenB = strlen(B+1) - 1;

    //边界
    for (int i = 0; i <= lenA; ++i)
    {
        dp[i][0] = 0;
    }

    for (int j = 0; j <= lenB; ++j)
    {
        dp[0][j] = 0;
    }

    //状态转移方程
    for (int i = 1; i <= lenA; ++i)
    {
        for (int j = 1; j <= lenB; ++j)
        {
            if(A[i] == B[j]){
                dp[i][j] = dp[i -1][j -1] + 1;
            }else{
                dp[i][j] = max(dp[i-1][j], dp[i][j-1]);
            }
        }
    }

    printf("%d\n", dp[lenA][lenB]);

    return 0;
}
发布了378 篇原创文章 · 获赞 52 · 访问量 5万+

猜你喜欢

转载自blog.csdn.net/qq_33375598/article/details/104451128