我有一个excel文件,可以用公式计算最后一列。我试图复制这到python代码。如何进行操作才能达到这样的效果?
本质上,最后一列应该是,例如,用第2行减去第0行(因为除了月份之外,它们共享相同的行业,我试图用月份来比较它们)。
我尝试使用for循环并取行i
的索引,然后减去行i
's 'No。i-2
的"No."并将结果添加到最后一列。然后,我将i
增加1以使操作继续进行到下一行,但是我没有成功。
Period Industry No. of jobs Difference from prev. month
0 January Farm 70200 N/A
1 January Mining 4900 N/A
2 February Farm 70100 -100
3 February Mining 4850 -50
4 March Farm 70200 100
5 March Mining 4600 -250
6 April Farm 70300 100
7 April Mining 5200 600
8 May Farm 70300 0
9 May Mining 5300 100
尝试如下:
df['Difference from prev. month'] = df['No. of jobs'].groupby(df['Industry']).diff()
df['Difference from prev. month']
0 NaN
1 NaN
2 -100.0
3 -50.0
4 100.0
5 -250.0
6 100.0
7 600.0
8 0.0
9 100.0
Name: Difference from prev. month, dtype: float64