我创建了一堆数据帧,它们是这样组织的(我们称之为df):
2014-12-31 2013-12-31 2012-12-31 2011-12-31
After Tax ROE 32 11 318 114
Cash Ratio 91 126 41 159
Current Ratio 152 188 97 195
Gross Margin 28 23 7 30
Operating Margin 6 3 95 123
Pre-Tax Margin 9 4 96 124
Pre-Tax ROE 31 11 318 113
Profit Margin 9 4 96 125
Quick Ratio 107 137 48 169
我写了一个脚本来抓取纳斯达克网站,并为不同的股票制作了一堆这些。我希望能够以这种格式比较一年内不同股票的这些比率:
2014
AAPL GOOG TSLA
ratio int int int
ratio int int int
ratio int int int
ratio int int int
我知道我可以引用像df[[0]]
这样的列来获得2014年特定数据框架的列。
但我想索引基于年份,所以它总是工作,无论如何列的方向。为此,我专门为df datetime对象设置了列标题。我怎么做呢?
可以将列设置为DateTimeIndex,这样可以更灵活地选择。
例如:import pandas as pd
import numpy as np
df = pd.DataFrame(
np.arange(10).reshape((5, 2)),
columns=pd.DatetimeIndex(['2014-04-14', '2015-05-15']))
print(df['2014'])