我的问题是如何从索引的字符串中删除时间部分。我正在导入一个带有分钟库存数据的csv,代码看起来像:
import pandas as pd
df = pd.read_csv(f'/Volumes/Seagate Portable/S&P 500 List/AAPL.txt')
df.columns = ['Extra', 'Dates', 'Open', 'High', 'Low', 'Close', 'Volume']
df.Dates = pd.to_datetime(df.Dates)
df.set_index('Dates', inplace=True)
df = df.between_time('9:30', '16:00')
df.drop(['Extra', 'Open', 'High', 'Volume', 'Low'], axis=1, inplace=True)
df = df.groupby(pd.Grouper(freq='D')).agg({'Close':'last'})
df.index[0]
这将修改数据帧以查找交易日的最后收盘价。其输出为:
Timestamp('2020-01-02 00:00:00', freq='D')
所以我的问题是,我想从字符串中删除时间(00:00:00(。我不想做这样的事情:
` df.index = df.index.date)`
或
df['date'] = pd.to_datetime(df.index).dt.date
这是因为df.index[0]
的输出将是:datetime.date(2020, 1, 2)
,这不是我想要的。所以我尝试的是
for df_dates in df.index:
string_df = f"{df_dates}"
split_string_df = string_df.split(' ')
df_dates = split_string_df[0]
df.index[df_dates] = df_dates
这给了我错误TypeError: Index does not support mutable operations
因此,我正在寻找一个代码,它将删除字符串的时间部分,在我可以索引出df['2020-2-12']
而不是df[datetime.date(2020, 1, 2)]
之后(我不确定,假设这意味着修改显示而不是实际索引,但我不知道。(
你尝试过吗:
indexes =[]
for df_dates in df.index:
string_df = f"{df_dates}"
split_string_df = string_df.split(' ')
df_dates = split_string_df[0]
indexes.append( df_dates)
df.index = indexes
问题是,您试图通过调用df.index[<something>] = <otherthing>
按索引修改索引,因为索引列表是不可变的,必须整体修改。。