编辑距离 51Nod - 1183
编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
Input
第1行:字符串a(a的长度 <= 1000)。
第2行:字符串b(b的长度 <= 1000)。
Output
输出a和b的编辑距离
Sample Input
kitten
sitting
Sample Output
3
题目分析:
扫描二维码关注公众号,回复:
2695425 查看本文章
这题也是类似求最长公共子序列。定义状态dp[i][j]:字符串a的前i个字符转换成字符串前j个字符的最少步数。
1.删除a的最后一个字符:此时把问题转换成求a的前i-1个字符转换成b的前j个字符,所以dp[i][j]=dp[i-1][j];
2.在a的末尾插入一个字符,此时把问题转化成求a的前i个字符转化成b的前j-1个字符,所以dp[i][j]=dp[i][j-1]
3.替换:如果a[i]==b[j],则dp[i][j]=dp[i-1][j-1],否则dp[i][j]=dp[i-1][j-1]+1
Accepted code:
#include<iostream>
#include<cstring>
#include<string>
using namespace std;
const int maxn=1005;
int dp[maxn][maxn];
int main()
{
string a,b;
while(cin>>a>>b)
{
for(int i=0;i<maxn;i++)
{
dp[i][0]=i;
dp[0][i]=i;
}
for(int i=1;i<=(int)a.size();i++)
{
for(int j=1;j<=(int)b.size();j++)
{
if(a[i-1]==b[j-1])
dp[i][j]=min(min(dp[i-1][j]+1,dp[i][j-1]+1),dp[i-1][j-1]);
else
dp[i][j]=min(min(dp[i-1][j]+1,dp[i][j-1]+1),dp[i-1][j-1]+1);
}
}
cout<<dp[a.size()][b.size()]<<endl;
}
}