当我们使用corr.()时,我们是否应该关心DataFrame中的NA数据



我试图计算DataFrame的相关矩阵。但我很困惑,我们应该用0替换所有NA数据还是删除它们?换句话说,NA数据会影响相关性的计算吗?

如果您使用相关性值根据数据集是否相关来对数据集进行分类,那么可以将NaN视为0。也许解释NaN输出的更好的方式是";不可解释";或";没有意义";而0的显著相关性意味着"0";无相关性";

另请参阅:

  • python-如何在数据矩阵中使用nans计算相关矩阵
  • 如何有效地获得具有NaN值的数据帧的相关矩阵(具有p值(

最新更新