我试图计算DataFrame的相关矩阵。但我很困惑,我们应该用0替换所有NA数据还是删除它们?换句话说,NA数据会影响相关性的计算吗?
如果您使用相关性值根据数据集是否相关来对数据集进行分类,那么可以将NaN视为0。也许解释NaN输出的更好的方式是";不可解释";或";没有意义";而0的显著相关性意味着"0";无相关性";
另请参阅:
- python-如何在数据矩阵中使用nans计算相关矩阵
- 如何有效地获得具有NaN值的数据帧的相关矩阵(具有p值(