如何找到字符串相似度



我正在开发关键词提取系统,预处理后,系统通过检查与相同模式匹配的文本来提取候选关键词

现在我想知道如何找到提取的候选关键词之间的相似感?例如,让我们看看下一个矩阵:

     k1   k2   k3
k1   1    ?1   ?2
k2   ?1   1    ?3
k3   ?2   ?3   1

how can I find the values of (?) ??? 
where 
    (?1) refer to the sense similarity degree between (k1) and (k2)
    (?2) refer to the sense similarity degree between (k1) and (k3)
    (?3) refer to the sense similarity degree between (k2) and (k3)

注意:关键字可以是一个单词或多个

您可能想查看WordNet::Similarity-它提供了WordNet 中单词意义之间的相似性度量

http://wn-similarity.sourceforge.net

最新更新