NumPy cov(协方差)函数的简单实现



我试图实现numpy.cov()函数如下所示:numpy cov(协方差)函数,它究竟计算什么?,但我得到了一些奇怪的结果。请纠正我:

import numpy as np  
def my_covar(X):  
    X -= X.mean(axis=0)  
    N = X.shape[1]  
    return np.dot(X, X.T.conj())/float(N-1)
X = np.asarray([[1.0,1.0],[2.0,2.0],[3.0,3.0]])
## Run NumPy's implementation
print np.cov(X)
"""  
NumPy's output:
[[ 0.  0.  0.]
 [ 0.  0.  0.]
 [ 0.  0.  0.]]
"""
## Run my implementation
print my_covar(X)  
"""  
My output:  
[[ 2.  0.  -2.]  
 [ 0.  0.  0.]  
 [ -2.  0.  2.]]  
"""

怎么了?

您的函数和np.cov(默认情况下)都假设X的行对应于变量,列对应于观测值

当您通过减去平均值来居中X时,您需要计算观测值的平均值,即X的列而不是行:

X -= X.mean(axis=1)[:, None]