Python提供fuzzywuzzy模块,不仅可用于计算两个字符串之间的相似度,而且还提供排序接口能从大量候选集中找到最相似的句子。
pip install fuzzywuzzy
两个模块:fuzz, process,fuzz主要用于两字符串之间匹配,process主要用于搜索排序。
from fuzzywuzzy import fuzz a = 'a b c' b = ' a c b ' c = 'a c' fuzz.ratio(a, c) >> 75 fuzz.ratio(b, c) >> 60 fuzz.partial_ratio(a, c) >> 67 fuzz.partial_ratio(b, c) >> 100 fuzz.token_sort_ratio(a, c) >> 75 fuzz.token_sort_ratio(b, c) >> 75 fuzz.token_set_ratio(a, c) >> 100 fuzz.token_set_ratio(b, c) >> 100