使用SM.ols时,我需要添加一个常数吗?



我在两组数据y和x上执行OLS。我使用statsmodel.api.ols。但是,无论是否在x上添加常数,我都发现了一些非常不同的结果。这是代码:

import statsmodels.api as sm
import numpy as np
mess = "SELECT .... FROM... WHERE ...."
data = np.array(db.extractData(mess))
Y = data[,:0]
X = data[,:1]
#Option1 
res = sm.OLS(Y,X).fit().rsquared ---> will return 0.76
#Option2
X = sm.add_constant(X)
res = sm.OLS(Y,X).fit().rsquared ---> will return 0.06

考虑到我是否添加常数,我认为我做错了什么。非常感谢您的时间。

您需要添加常数。从文档中:http://www.statsmodels.org/devel/generated/statsmodels.regression.linear_model.ols.html

An intercept is not included by default and should be added by the user. See statsmodels.tools.add_constant.

最新更新