编辑距离

编辑距离是针对二个字符串(例如英文字)的差异程度的量化量测,量测方式是看至少需要多少次的处理才能将一个字符串变成另一个字符串。

  • 莱文斯坦距离:操作允许 删除、加入、取代 字符串中的任何一个字元
  • Damerau-Levenshtein 距离:删除、加入、取代、转置(交换字元位置)
  • LCS(最长公共子序列):删除、加入
  • Jaro 距离:转置。
  • 汉明距离:取代。