统计模型给出许多系数的OLS回归



我试图对数据集中给定数据大小的加密时间进行简单的回归。我是python和statsmodels的初学者,但我认为OLS回归会得到奇怪的结果,因为它为我提供了每个数据大小的系数,比如:

DataSize[T.1024] 0.0001
DataSize[T.1040] 0.0003
DataSize[T.1056] 0.0004
DataSize[T.1072] 0.0006
DataSize[T.1088] 0.0007

这是我开发的代码:

encrypt_key_16 = select_total_encrypt_time.loc[select_total_encrypt_time['KeySize'] == 16]
y4, X4 = dmatrices('Measure ~ DataSize', data=encrypt_key_16, return_type='dataframe')
mod4 = sm.OLS(y4, X4)
result4 = mod4.fit()

我做错什么了吗?

提前感谢您的回答。

好的,我想我发现了问题所在。当我打印数据帧X4时,我得到了以下输出:

打印X4 时输出

因此,我需要以某种方式使它仅为DataSize的一列。

最新更新