如何使用gensim找出语料库中向量中的Jaccard索引?
您可以使用
gensim.matutils.jaccard(vec1, vec2)
计算两个向量的杰卡德距离。另请参阅gensim文档:
gensim.matutils.jaccard(vec1, vec2(
计算向量之间的杰卡德距离。参数:
vec1 ({scipy.sparse, numpy.ndarray, list of (int, float)}) – Distribution vector. vec2 ({scipy.sparse, numpy.ndarray, list of (int, float)}) – Distribution vector.
返回:vec1 和 vec2 之间的杰卡德距离。范围 [0, 1] 中的值,其中 0 为最小距离(最大相似性(,1 为最大距离(最小值( 相似性(。
返回类型:浮点型