python-Levenshtein常用函数

tech2026-03-10  1

 

编辑距离

Levenshtein.distance(str1, str2)

汉明距离

计算汉明距离。要求str1和str2必须长度一致。是描述两个等长字串之间对应位置上不同字符的个数。

Levenshtein.hamming(str1, str2)

莱文斯坦比

计算公式  r = (sum – ldist) / sum, 其中sum是指str1 和 str2 字串的长度总和,ldist是类编辑距离。注意这里是类编辑距离,在类编辑距离中删除、插入依然+1,但是替换+2。

Levenshtein.ratio(str1, str2)

Jaro/Jaro-Winkler距离

关于Jaro/Jaro-Winkler Distance可以看下之前发布的这篇文章编辑距离算法之Jaro-Winkler Distance

Levenshtein.jaro(s1, s2) Levenshtein.jaro_winkler(s1, s2)

 

最新回复(0)