我试图对数据集中给定数据大小的加密时间进行简单的回归。我是python和statsmodels的初学者,但我认为OLS回归会得到奇怪的结果,因为它为我提供了每个数据大小的系数,比如:
DataSize[T.1024] 0.0001
DataSize[T.1040] 0.0003
DataSize[T.1056] 0.0004
DataSize[T.1072] 0.0006
DataSize[T.1088] 0.0007
这是我开发的代码:
encrypt_key_16 = select_total_encrypt_time.loc[select_total_encrypt_time['KeySize'] == 16]
y4, X4 = dmatrices('Measure ~ DataSize', data=encrypt_key_16, return_type='dataframe')
mod4 = sm.OLS(y4, X4)
result4 = mod4.fit()
我做错什么了吗?
提前感谢您的回答。
好的,我想我发现了问题所在。当我打印数据帧X4时,我得到了以下输出:
打印X4 时输出
因此,我需要以某种方式使它仅为DataSize的一列。