我想在python中关联两个二进制数据。 例如,下面是两个数组。
arr1 = [0,1,0,1,1,1,1]
arr2 = [0,0,1,1,1,1,1]
我想知道这两个数据的相关系数。
我知道连续变量和连续变量使用皮尔逊或肯德尔的方法。
在二进制类型和连续类型的情况下,可以使用点双序列相关系数方法。
以上方法都在python的scipy中。
但是我不知道如何衡量二进制类型和二进制类型之间的相关系数。
谢谢你让我知道。
此链接为您提供了一些计算二进制变量相关性的建议。
https://stats.stackexchange.com/questions/103801/is-it-meaningful-to-calculate-pearson-or-spearman-correlation-between-two-boolea
引用原文答案: 皮尔逊或肯德尔的可能不是两个二进制向量的良好相似性指标。您可以使用
- 杰卡德-李约瑟
- 骰子
- 圣诞节 拉
- 塞尔-拉奥
- 索卡尔-米切纳
- 罗杰斯-谷本
- 库尔津斯基