如何在panda中以最少的nan值选择特定时间段?



我有一个数据集,其中有相当多的数据丢失,存储了几年的每小时数据。我现在要实现一个季节性填充方法,我需要在接下来的两年(2*8760个条目)的最佳数据。这意味着在接下来的两年中丢失的数据量最少(或nan值最少)。然后我需要结束时间和开始时间在日期时间格式的这段时间。我的数据存储在一个数据框中,索引是每小时的datetime。我怎样才能做到这一点呢?

编辑:为了更清楚一点,我需要从两年(或2*8760行)的时间段中选择出现nan值最少的所有条目(值和nan值)。

您可以使用df = df.dropna()

从数据中删除所有NAN值

最新更新