我有一个简单的熊猫数据框。
import pandas as pd
x = [5, 10, 20, 30, 5, 10, 20, 30, 5, 10, 20, 30]
y = [100, 100, 200, 200, 300, 300, 400, 400, 500, 500, 600, 600]
users =['mark', 'mark', 'mark', 'rachel', 'rachel', 'rachel', 'jeff', 'jeff', 'jeff', 'lauren', 'lauren', 'lauren']
df = pd.DataFrame(dict(x=x, y=y, users=users)
我想保留数据框的某些行。让我们说所有的"瑞秋"和"杰夫"。我试过df.query
:
df=df.query('users=="rachel"' or 'users=="jeff"')
结果是仅具有 users=="rachel"
的数据框。有没有办法组合查询?
标准方法是使用按位或运算符|
。为了清楚地解释原因,我建议查看此答案。由于 Python 的评估顺序,您还需要在每个条件周围使用括号。
df[(df.users == 'rachel') | (df.users == 'jeff')]
users x y
3 rachel 30 200
4 rachel 5 300
5 rachel 10 300
6 jeff 20 400
7 jeff 30 400
8 jeff 5 500
使用查询,您仍然可以只使用 or 运算符:
df.query("users=='rachel' | users=='jeff'")
users x y
3 rachel 30 200
4 rachel 5 300
5 rachel 10 300
6 jeff 20 400
7 jeff 30 400
8 jeff 5 500
另一种方式是:
df=df.query('users=="rachel"').append(df.query('users=="jeff"'))