我有这个形状为 22341x3 的数据帧:
tID DateTime
0 1 2020-04-04 10:15:40
1 2 2020-04-04 10:15:56
2 2 2020-04-04 11:07:11
3 3 2020-04-04 11:08:14
4 3 2020-04-04 11:18:46
5 4 2020-04-04 11:23:56
6 5 2020-04-04 11:24:14
7 6 2020-04-04 11:29:12
8 7 2020-04-04 11:29:23
9 8 2020-04-04 11:34:23
现在,我必须创建一个名为merged_timestamp
的列,该列合并所有仅相隔几秒钟的时间戳,并给它们一个新数字:mtID
例如:如果我们将2020-04-04 10:15:40
作为参考,则相隔几秒钟的时间戳可以从40
秒到44
秒。与参考相比,它们可以有小时和分钟有很大的差距,但它们的秒应该只相隔几秒钟才能合并。
任何帮助将不胜感激。
编辑:我尝试做dfd.resample('5s')[0:5]
其中dfd是我的数据帧。它给了我这个错误TypeError: Only valid with DatetimeIndex, TimedeltaIndex or PeriodIndex, but got an instance of 'RangeIndex'
重新采样适用于索引,因此将日期时间设为索引;
df.index = pd.to_datetime(df['DateTime'])
然后你可以重新采样;
df.resample('5s').count()
或其他一些聚合,不确定您要做什么。然后你可以删除你不感兴趣的行。