spark 两个dataframe的两个列的编辑距离

import org.apache.spark.sql.functions

val jdf = df1.join(df2,functions.levenshtein(df2("str_col1"),df1("str_col2"))<5)
发布了1142 篇原创文章 · 获赞 196 · 访问量 260万+

猜你喜欢

转载自blog.csdn.net/guotong1988/article/details/104037688