计算两个字符串之间的距离--python3

距离定义

给定两个单词 word1 和 word2,计算出将 word1 转换成 word2 所使用的最少操作数。
你可以对一个单词进行如下三种操作:
插入一个字符
删除一个字符
替换一个字符

示例 1:

输入: word1 = "horse", word2 = "ros"
输出: 3
解释: 
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')

示例 2:

输入: word1 = "intention", word2 = "execution"
输出: 5
解释: 
intention -> inention (删除 't')
inention -> enention (将 'i' 替换为 'e')
enention -> exention (将 'n' 替换为 'x')
exention -> exection (将 'n' 替换为 'c')
exection -> execution (插入 'u')

思路

来自这里

假设字符串 a, 共 m 位,从 a[1] 到 a[m](注意是是从1下标)
字符串 b, 共 n 位,从 b[1] 到 b[n]
d[i][j] 表示字符串 a[1]-a[i] 转换为 b[1]-b[j] 的编辑距离

那么有如下规律(a[i] 和 b[j] 分别是字符串 a 和 b 的最后一位):

  • 当 a[i] 等于 b[j] 时,d[i][j] = d[i-1][j-1], 比如 fxy -> fay 的编辑距离等于 fx -> fa 的编辑距离

  • 当 a[i] 不等于 b[j] 时,d[i][j] 等于如下 3 项的最小值:

    • d[i-1][j] + 1(删除 a[i]), 比如 fxy -> fab 的编辑距离 = fx -> fab 的编辑距离 + 1
    • d[i][j-1] + 1(插入 b[j]), 比如 fxy -> fab 的编辑距离 = fxyb -> fab 的编辑距离 + 1 = fxy -> fa 的编辑距离 + 1
    • d[i-1][j-1] + 1(将 a[i] 替换为 b[j]), 比如 fxy -> fab 的编辑距离 = fxb -> fab 的编辑距离 + 1 = fx -> fa 的编辑距离 + 1
  • 递归边界(这也是为啥下标从1开始的)

    • a[i][0] = i, b 字符串为空,表示将 a[1]-a[i] 全部删除,所以编辑距离为 i
    • a[0][j] = j, a 字符串为空,表示 a 插入 b[1]-b[j],所以编辑距离为 j

主题思路是这个,可以采用两种思路
这里不理解的看后面的代码就明白了

  • (分治法 – 从后向前)
  • (动态规划 – 从前向后)

代码


class Solution:
    @staticmethod
    def minDistance_dp( word1, word2):
        """
        :type word1: str
        :type word2: str
        :rtype: int
        本思路采用动态规划
        """
        len_word1=len(word1)
        len_word2=len(word2)
        dp=[]
        for row in range(len_word1+1):
            this_tmp=[]
            for col in range(len_word2+1):
                if row==0:
                    this_tmp.append(col)
                elif col==0:
                    this_tmp.append(row)
                else:
                    this_tmp.append(False)
            dp.append(this_tmp)
        # print(dp)
        for row in range(1,len_word1+1):
            for col in range(1,len_word2+1):
                if word1[row-1]==word2[col-1]:
                    dp[row][col]=dp[row-1][col-1]
                else:
                    dp[row][col]=min(dp[row-1][col],dp[row-1][col-1],dp[row][col-1])+1
        return dp[len_word1][len_word2]

    @staticmethod
    def minDistance_Divide(word1, word2):
    '''
            本思路采用分治法
    '''
        len_word1=len(word1)
        len_word2=len(word2)
        def divde(i_a,j_b):
            if i_a==0:
                return j_b
            if j_b==0:
                return i_a
            if word1[i_a-1]==word2[j_b-1]:
                return divde(i_a-1,j_b-1)
            else:
                return min(divde(i_a-1,j_b)+1,divde(i_a-1,j_b-1)+1,divde(i_a,j_b-1)+1)
        return divde(len_word1,len_word2)

if __name__=="__main__":
    word1 = "intention"
    word2 = "execution"
    word1 = "22"
    word2 = "e"
    print(Solution.minDistance_dp(word1,word2))

猜你喜欢

转载自blog.csdn.net/qq_32806793/article/details/85335672