如何从包含前两列组合的熊猫数据框架中删除行

我试图摆脱包含pandas dataframe中前两个列元素组合的行，例如，在下一个df：

中

     event1    event2    uccs   ulags
0  327423.0  329243.0  0.1663 -0.6013
1  327423.0  329589.0  0.1911 -0.4730
2  329243.0  327423.0  0.1663  0.6013
3  329243.0  329589.0  0.3101 -0.7502
4  329589.0  327423.0  0.1911  0.4730
5  329589.0  329243.0  0.3101  0.7502

行0和2列出了元素的组合：event1和event2。那就是：

0  327423.0  329243.0
2  329243.0  327423.0

通常，我需要将矩阵或DF减少到3行，以删除所有重复项。

我尝试了下一个没有成功的尝试：

 u = df.filter(like='event1').values
 m = pd.DataFrame(np.sort(u, axis=1)).duplicated()

这样做：

    event1    event2    uccs   ulags
0  327423.0  329243.0  0.1663 -0.6013
2  329243.0  327423.0  0.1663  0.6013
4  329589.0  327423.0  0.1911  0.4730

但是，如您所见，第0和2行是重复的。关于如何在熊猫或numpy中执行此操作的任何技巧将不胜感激。

如果我正确理解您，您非常接近，您只需要将布尔数组传递回boolean indexing的数据框：

df[~pd.DataFrame(np.sort(df.filter(like='event'), axis=1)).duplicated()]
     event1    event2    uccs   ulags
0  327423.0  329243.0  0.1663 -0.6013
1  327423.0  329589.0  0.1911 -0.4730
3  329243.0  329589.0  0.3101 -0.7502

请注意我使用的~是逆的或不是运算符：

m = pd.DataFrame(np.sort(df.filter(like='event'), axis=1)).duplicated()
print(m)
0    False
1    False
2     True
3    False
4     True
5     True
dtype: bool

现在倒数：

print(~m)
0     True
1     True
2    False
3     True
4    False
5    False
dtype: bool

相关内容

最新更新

热门标签：