以最有效的方式对Pandas数据帧进行排序和筛选



我想按列名"duration"进行筛选,然后显示大于200的值。这只是数据集的一个片段。我有一个非常庞大的数据集。我可以使用df[df.duration>200]。但是,这会在整个数据帧上运行。有没有什么方法可以让我专门针对列持续时间,然后过滤数据,只显示列持续时间而不引入新的数据帧。此外,一些与在巨大数据集(工作环境(中优化相同内容相关的解释也会有所帮助。

import pandas as pd
data = {
"calories": [420, 380, 390,100],
"duration": [50, 40, 45,300]
}
df = pd.DataFrame(data)

使用panda,我认为df[df.duration > 200]将是最好的选择之一,但我渴望与任何替代方案进行比较。

最新更新