问题:根据第三列的值创建Pearson相关系数。
首先,我有一个包含3列的数据框架。A、 B和C
Col。A和B包含float64类型,而在C中有对象。我想得到A和B列的Pearson相关系数。
print(df[A'].corr(df['B'],method='pearson'((-->这适用于整个列。
下一步我会努力。列C只有2个值。让我们称它们为c1和c2。现在我想得到c1和c2的系数。我试过
对于c2也是如此。记录的错误为:TypeError:不支持&:'的操作数类型float和str如何在不拆分数据帧的情况下同时获得这两个系数?
提前感谢
这应该可以实现您想要的:
print(df[df['C']=='c1']['A'].corr(df[df['C']=='c1']['B'],method='pearson'))
df[df['C']=='c1']
检索数据帧的子集,其中列C中的值为"c1",然后您只需像往常一样调用所需的列。