tanimoto coefficient in the book of Programming Collective I



我读过《编程集体智能》一书。对于第二章的课后练习1,有人能告诉我如何计算谷本系数吗?一个具体的数学公式将不胜感激。

对一个相关问题的广泛搜索给了我两个公式:

  1. T(a,b)=N_intersection/(N_a+N_b-N_intersection),这与维基百科上的内容相同,可读性略高。编辑:根据你的评论,这就是OP正在寻找的。

  2. (n_11+n_00)/[n_11+2(n_10+n_01)+n_00],其中

    • n_ 11:二者都具有属性
    • n_00:两者都没有属性
    • n_01或n_10:只有第二个/第一个对象具有该属性

关于第二个方程式的来源,请看http://reference.wolfram.com/language/ref/RogersTanimotoDissimilarity.html并根据相异性指数计算相似性指数作为(1-相似性)。

我相信第二个公式在应用统计学和应用营销中很常用。

最新更新