请为我解释以下代码行.即使用数据帧的2列创建熊猫系列


industry_usa = f500["industry"][f500["country"] == "USA"].value_counts().head(2)

这是一个数据帧,其中一些列是industrycountry。那么,为什么在创建indsutry_usa系列时需要并排定位这两列呢。请解释。

我将为您分解:

f500["industry"]:选择具有相同名称的系列(列(。

f500["country"] == "USA":这将返回一个布尔索引,其中包含country列为USA的所有行的True

f500["industry"][f500["country"] == "USA"]:正如你可能已经猜到的,这就像我们在熊猫身上做的任何其他索引一样。因此,它选择所有那些">行业";s其中国家是";USA";。

.value_counts():只是对唯一值进行计数。就像我们在python中的Counter类中一样

注意:有趣的是,您可以将顺序更改为-f500[f500["country"] == "USA"]["industry"],但仍然会得到相同的结果!!

最新更新