我正在下载历史CPI数字,并想知道如何将年、月和月的数字划分为自己的列。通常,我会用列中的逗号分隔字符串。然而,当提取数字时,我不明白。按字符串中字符的位置进行拆分最容易吗?
import cpi
import pandas as pd
cpi.update()
series_df =cpi.series.get_by_id("CUSR0000SA0")
Series_CPI_DF =pd.DataFrame(series_df.indexes)
Series_CPI_DF.to_excel('S_CPI_DF.xlsx')
我最后得到的一个例子是"2005-06-01(六月(:193.7"。
您可以使用to_dataframe
方法而不是pd.DataFrame
,并选择所需的列。
import cpi
import pandas as pd
cpi.update()
series_df =cpi.series.get_by_id("CUSR0000SA0")
Series_CPI_DF = series_df.to_dataframe()[['year', 'date', 'value', 'period_name']]
Series_CPI_DF.to_excel('S_CPI_DF.xlsx')
#输出:
print(Series_CPI_DF)
year date value period_name
0 1997 1997-01-01 159.4 January
1 1997 1997-02-01 159.7 February
2 1997 1997-03-01 159.8 March
3 1997 1997-04-01 159.9 April
4 1997 1997-05-01 159.9 May
.. ... ... ... ...
903 1996 1996-08-01 157.2 August
904 1996 1996-09-01 157.7 September
905 1996 1996-10-01 158.2 October
906 1996 1996-11-01 158.7 November
907 1996 1996-12-01 159.1 December
[908 rows x 4 columns]