>我有以下数据集:
1( 以月份为时间戳的数据集
df = pd.DataFrame(residuals, columns = ['Passengers'])
Passengers
Month
1949-01-01 -0.082329
1949-02-01 -0.040724
1949-03-01 0.060813
1949-04-01 0.027243
1949-05-01 -0.047359
1949-06-01 0.051545
1949-07-01 0.132902
1949-08-01 0.122322
b( 以月份为Int 的数据集
dz = pd.DataFrame(estacionalitat, columns = ['Passengers'])
Passengers
Month
1 -0.075844
2 -0.089111
3 0.042705
4 0.002147
5 -0.010528
6 0.109443
7 0.198334
8 0.209830
已在两个数据集中执行了一组转换,但最初数据来自以下数据集:
data = pd.read_csv('AirPassengers.csv', parse_dates=['Month'], index_col='Month', header=0)
我想从另一个数据集中减去一个数据集,如下所示:
df-dz
但是,当我尝试执行上述操作时,我收到以下消息:
无法将类型"时间戳"与类型"int"进行比较
我想这是因为"月"在一个数据集中是 int 类型,而在另一个数据集中是 Date 类型。此外,我不知道如何访问"月",因为它不被理解为列。
如果要将DatetimeIndex
转换为月份,请使用:
df.index = df.index.month
然后在两者中获取整数,列名相同,因此可能减去:
df = df-dz
print (df)
Passengers
Month
1 -0.006485
2 0.048387
3 0.018108
4 0.025096
5 -0.036831
6 -0.057898
7 -0.065432
8 -0.087508