industry_usa = f500["industry"][f500["country"] == "USA"].value_counts().head(2)
这是一个数据帧,其中一些列是industry
和country
。那么,为什么在创建indsutry_usa
系列时需要并排定位这两列呢。请解释。
我将为您分解:
f500["industry"]
:选择具有相同名称的系列(列(。
f500["country"] == "USA"
:这将返回一个布尔索引,其中包含country列为USA的所有行的True
。
f500["industry"][f500["country"] == "USA"]
:正如你可能已经猜到的,这就像我们在熊猫身上做的任何其他索引一样。因此,它选择所有那些">行业";s其中国家是";USA";。
.value_counts()
:只是对唯一值进行计数。就像我们在python
中的Counter
类中一样
注意:有趣的是,您可以将顺序更改为-f500[f500["country"] == "USA"]["industry"]
,但仍然会得到相同的结果!!