Jaccard index in python for a corpus using gensim



如何使用gensim找出语料库中向量中的Jaccard索引?

您可以使用

gensim.matutils.jaccard(vec1, vec2)

计算两个向量的杰卡德距离。另请参阅gensim文档:

gensim.matutils.jaccard(vec1, vec2(

计算向量之间的杰卡德距离。参数:

vec1 ({scipy.sparse, numpy.ndarray, list of (int, float)}) – Distribution vector.
vec2 ({scipy.sparse, numpy.ndarray, list of (int, float)}) – Distribution vector.

返回:vec1 和 vec2 之间的杰卡德距离。范围 [0, 1] 中的值,其中 0 为最小距离(最大相似性(,1 为最大距离(最小值( 相似性(。

返回类型:浮点型

最新更新