在 Python 中为新的日期格式组合列



我是Python的新手,所以任何帮助或建议都非常感谢,如果我问非常明显的事情,我们很抱歉。 我有以下数据:

WMO_NO  YEAR  MONTH  DAY  HOUR  MINUTE   H     PS    T  RH    TD WDIR   WSP
0    4018  2006      1    1    11      28  38  988.6  0.9  98   0.6  120  14.4
1    4018  2006      1    1    11      28  46  987.6  0.5  91  -0.7  122  15.0
2    4018  2006      1    1    11      28  57  986.3  0.5  89  -1.1  124  15.5
3    4018  2006      1    1    11      28  66  985.1  0.5  90  -1.1  126  16.0
4    4018  2006      1    1    11      28  74  984.1  0.4  90  -1.1  127  16.5

我想将年月日小时分钟合并到一个格式为年:月:日:小时:分钟的新列中(然后使用此列索引 T 数据(并进行一些分析。 我的第一个问题是如何创建这样一个新列?第二个是我可以对这个专栏进行比较和分析吗(年:月:日:小时:分钟>2007:04:13:04:44(? 干杯。

您可以使用to_datetime,然后在必要时Series.dt.strftime自定义格式,请检查 http://strftime.org/:

df['date'] = pd.to_datetime(df[['YEAR','MONTH','DAY','HOUR','MINUTE']])
df['date_new'] = df['date'].dt.strftime('%Y:%m:%d:%H:%M')
print (df)
WMO_NO  YEAR  MONTH  DAY  HOUR  MINUTE   H     PS    T  RH   TD  WDIR  
0    4018  2006      1    1    11      28  38  988.6  0.9  98  0.6   120   
1    4018  2006      1    1    11      28  46  987.6  0.5  91 -0.7   122   
2    4018  2006      1    1    11      28  57  986.3  0.5  89 -1.1   124   
3    4018  2006      1    1    11      28  66  985.1  0.5  90 -1.1   126   
4    4018  2006      1    1    11      28  74  984.1  0.4  90 -1.1   127   
WSP                date          date_new  
0  14.4 2006-01-01 11:28:00  2006:01:01:11:28  
1  15.0 2006-01-01 11:28:00  2006:01:01:11:28  
2  15.5 2006-01-01 11:28:00  2006:01:01:11:28  
3  16.0 2006-01-01 11:28:00  2006:01:01:11:28  
4  16.5 2006-01-01 11:28:00  2006:01:01:11:28  

如果您的数据由整数而不是字符串组成,您可以使用它来创建日期时间索引:

import pandas as pd
import datetime as dt
columns = ['ID', 'Year', 'Month', 'Day', 'Hour', 'Minute']
data = [ ['1', 2006, 1, 1, 11, 28],
['2', 2006, 1, 1, 11, 29]]
df = pd.DataFrame(data=data, columns=columns)
df.index = df.apply(lambda x: dt.datetime(x['Year'], x['Month'], x['Day'], x['Hour'], x['Minute']), axis=1) 

最新更新