我们已在Levenshtein long的基础上执行。 由于我们计算了所有可能的替代物的距离(Levenshtein long between two string dated O(n^2)
,我们使用 rel=“nofollow noreferer”>K-gramindex,用于重新计算替代候选人。
因此,K-gram指数只是迅速消除不相干的替代方法之一。 我也对其他方式感兴趣。 此时,我们又使用了几个trick。 考虑到我们只有兴趣从最初的座右铭中替代光线距离d,我们可以使用以下规则:
- the edit distance between two string couldn t be less that length difference between them. So substitutions with length difference greater than d could be eliminated;
- one character change/remove in string change at least
k
k-grams. So the strings with count difference of k-gramsk * d
could not have edit distance less than d: .
这些假设是否正确? 有哪些其他替代方法适用于 spell客?