使用 & / np.where() / np.any() 比较 Pandas 中多个列的布尔行值

我有一个看起来像：

的数据框架

   a A  a B  a C  a D  a E  a F  p A  p B  p C  p D  p E  p F
0    0    0    0    0    0    0    0    0    0    0    0    0
1    1    0    0    0    0    0    0    0    0    0    0    0
2    0    1    0    0    0    0    0    0    1    0    0    0
3    0    0    1    0    0    1    0    0    0    0    0    0
4    0    0    0    1    0    1    0    0    0    0    0    0
5    0    0    0    0    1    0    0    0    0    0    0    0
6    0    0    0    0    0    0    1    0    0    0    0    0
df = pd.DataFrame({'p A':[0,0,0,0,0,0,1],'p B':[0,0,0,0,0,0,0],'p C':[0,0,1,0,0,0,0],'p D':[0,0,0,0,0,0,0],'p E':[0,0,0,0,0,0,0],'p F':[0,0,0,0,0,0,0],'a A':[0,1,0,0,0,0,0],'a B':[0,0,1,0,0,0,0],'a C':[0,0,0,1,0,0,0],'a D':[0,0,0,0,1,0,0],'a E':[0,0,0,0,0,1,0],'a F': [0,0,0,1,1,0,0]})

注意：这是我实际数据的简化版本。

代表实际；P代表预测；a -f代表一系列标签

我想编写一个查询，对于我的数据框中的每一行，返回true时：（" p列"中的所有行值= 0）and（至少一个行中的一个行值= 1中的一个行值= 1）即对于每一行，p列固定为0，至少为1 a列= 1。

使用PANDAS DataFrame的答案找到所有列的行，并使用PANDAS比较两列我目前使用&和np.any()

实现了这一目标

((df.iloc[:,6] == 0) & (df.iloc[:,7] == 0) & (df.iloc[:,8] == 0) & (df.iloc[:,9] == 0) & (df.iloc[:,10] == 0) & (df.iloc[:,11] == 0) & df.iloc[:,0:6].any(axis = 1) )
>>
0    False
1     True
2    False
3     True
4     True
5     True
6    False
dtype: bool

我可以实现一种更简洁，可读的方法吗？

您可以将~用于Invert boolean蒙版，并用iloc进行选择：

：

print (~df.iloc[:,6:11].any(1) & df.iloc[:,0:6].any(1))
0    False
1     True
2    False
3     True
4     True
5     True
6    False
dtype: bool

或使用filter进行列名选择，any至少检查一个True或all，以检查是否所有值是每行True。

功能eq用于与0相比。

print (~df.filter(like='p').any(1) & df.filter(like='a').any(1))
0    False
1     True
2    False
3     True
4     True
5     True
6    False
dtype: bool

print (df.filter(like='p').eq(0).all(1) & df.filter(like='a').any(1))
0    False
1     True
2    False
3     True
4     True
5     True
6    False
dtype: bool

相关内容

最新更新

热门标签：