如何保存解析的日期pandas dataframe

我正在阅读CSV文件和解析日期。

train = pd.read_csv('sales_train.csv', parse_dates=['date'])
date    
2015-10-10
2015-09-10
2015-10-14
2015-10-22
2015-03-10

在这一点上，数据框已正确解析。如果我需要第二天访问相同的数据框，我不想再次解析日期列，而花10分钟进行计算。如何保存已解析日期的数据框架？

您可以发布一些代码和示例数据吗？

如果您正在运行pd.to_datetime(df['date'])之类的东西，但没有保存在任何地方，请尝试：

df['date'] = pd.to_datetime(df['date'])

在解析日期之后，建议将数据框保存在 parquet >或 HDF 格式中：

df.to_parquet('df.parquet', engine='fastparquet')
df.to_hdf('df.h5','table_name',append=True)

如果我想阅读，

df.to_parquet('df.parquet', engine='fastparquet')
df.to_hdf('df.h5','table_name',append=True)

注意1：安装此库

很重要

conda install fastparquet pyarrow python-snappy -c conda-forge

注2： parquet格式小于HDF

相关内容