[repost ]字符串相似度和字符串编辑距离
original:http://ift.tt/1aOmLdo 余弦相似度 计算公式为: P(A,B) = sqrt(A × B) / (|A| × |B|) 设有两个字符串: ABCDEFG ABCHIJK 其中共有11个字符,为: A B C D E F G H I J K 如果,不考虑他们之间的关联性以及顺序等隐私,那么可以讲这两个字符串转换成两个11维空间中的向量: {1、1、1、1、1、1、1、0、0、0、0} {1、1、1、0、0、0、0、1、1、1、1} 那,计算他们之间的相似度为: P = sqrt(3) / (sqrt(7) × sqrt(7)) = 0.2474358297 矩阵相似度 给定两个长度相等的字符串,在移动的过程中比较: a b c d d a c b c b a a d [...]
via WordPress http://ift.tt/LYoOWT
via WordPress http://ift.tt/LYoOWT
Labels: hanhuiwen
0 Comments:
Post a Comment
<< Home