基于索引的Pandas数据帧掩码



我有以下数据帧:

import pandas as pd
index = pd.date_range('2013-1-1',periods=10,freq='15Min')
data = pd.DataFrame(data=[1,2,3,4,5,6,7,8,9,0], columns=['value'], index=index)

如何根据索引值生成掩码?我知道我可以做一些类似的事情:

data['value'] > 3
Out[40]: 
2013-01-01 00:00:00    False
2013-01-01 00:15:00    False
2013-01-01 00:30:00    False
2013-01-01 00:45:00     True
2013-01-01 01:00:00     True
2013-01-01 01:15:00     True
2013-01-01 01:30:00     True
2013-01-01 01:45:00     True
2013-01-01 02:00:00     True
2013-01-01 02:15:00    False
Freq: 15T, Name: value, dtype: bool

我想生成一个掩码,只考虑索引在某个范围内的一些行。我想做一些类似data['index'].time() > datetime.time(1,15)的事情来生成一个掩码。当然,data['index']失败是因为索引不是列的名称。如何引用掩码中一行的索引值?

您可以使用indexer_between_time:进行掩码

In [11]: data.index.indexer_between_time(start='01:15', end='02:00')
Out[11]: array([5, 6, 7, 8])
In [12]: data.iloc[data.index.indexer_between_time(start='1:15', end='02:00')]
Out[12]:
                     value
2013-01-01 01:15:00      6
2013-01-01 01:30:00      7
2013-01-01 01:45:00      8
2013-01-01 02:00:00      9

如您所见,您可以通过属性.index访问索引

注意:默认情况下,indexer_between_time include_startinclude_end都为True,它还提供了一个tz参数来比较不同时区的时间。

不赞成使用"start"one_answers"stop"关键字。熊猫>17.1;我不得不使用以下语法:

data.iloc[data.index.indexer_between_time('1:15', '02:00')]
Out[90]: 
                     value
2013-01-01 01:15:00      6
2013-01-01 01:30:00      7
2013-01-01 01:45:00      8
2013-01-01 02:00:00      9

相关内容

最新更新