我有一个关于我的数据集的问题。我想检查哪个日期+时间在我的数据框中缺失(见图)。DF我想知道这个列名为'starttime'和'endtime'。
我该如何解决这个问题?
我试着
pd.date_range(start = '2019-01-01 00:00:00', end = '2022-12-31 23:00:00' ).difference(allmerged.index)
但是这行不通。
尝试注释中建议的代码会得到这样的输出:输出图像
首先在样本数据中有频率15Min
,如果需要测试该频率,将参数freq
添加到date_range
:
r = pd.date_range(start='2019-01-01 00:00:00', end='2022-12-31 23:00:00', freq='15Min')
必要时将两列转换为datetimes:
df[['starttime','endtime']] = df[['starttime','endtime']].apply(pd.to_datetime)
Index.difference
的最后一次测试:
#testing both together
out = r.difference(np.ravel(df[['starttime','endtime']].to_numpy()))
out = r.difference(df[['starttime','endtime']].stack())
#testing separately
start = r.difference(df['starttime'])
end = r.difference(df['endtime'])