如何在熊猫身上进行滚动回归



我有以下代码(它在循环中效率不高(。

from scipy.stats import linregress
results =[]
for pos in range(126, len(data)) :
results.append(linregress(data.a.iloc[(pos-126):pos], data.b.iloc[(pos-126):pos])[0])

如何以更高效的形式重写此代码?可以做滚动申请吗?

非常感谢。

所以我最终在一个循环中完成了这项工作,而不是最好的解决方案。显然不是一个好的解决方案,尽管它有效。

有更好的主意吗!

grouped = full_sample.groupby('ID')
df = pd.DataFrame()
for name, group in grouped:
a=[]
if len(group) > 126:
for pos in range(126, len(group)) :
a.append(linregress(group.x.iloc[(pos-126):pos], group.y.iloc[(pos-126):pos])[0])
data= pd.DataFrame(a, index= (group.index.get_level_values(0).unique())[126:] ).assign(ID=name).set_index('ID', append=True)
df.append(data)

谢谢。

最新更新