编辑距离
Levenshtein.distance(str1, str2)
汉明距离
计算汉明距离。要求str1和str2必须长度一致。是描述两个等长字串之间对应位置上不同字符的个数。
Levenshtein.hamming(str1, str2)
莱文斯坦比
计算公式 r = (sum – ldist) / sum, 其中sum是指str1 和 str2 字串的长度总和,ldist是类编辑距离。注意这里是类编辑距离,在类编辑距离中删除、插入依然+1,但是替换+2。
Levenshtein.ratio(str1, str2)
Jaro/Jaro-Winkler距离
关于Jaro/Jaro-Winkler Distance可以看下之前发布的这篇文章编辑距离算法之Jaro-Winkler Distance
Levenshtein.jaro(s1, s2)
Levenshtein.jaro_winkler(s1, s2)