import org.apache.spark.sql.functions
val jdf = df1.join(df2,functions.levenshtein(df2("str_col1"),df1("str_col2"))<5)
spark 两个dataframe的两个列的编辑距离
猜你喜欢
转载自blog.csdn.net/guotong1988/article/details/104037688
今日推荐
周排行