PySpark-筛选基于条件的选择.groupby



我正试图使用.groupBy函数来根据国家=美国的位置查找AVG分数

这是我目前的代码:这个代码适用于显示每个国家,但我只想让它显示基于位置的平均分数,只适用于来自美国的玩家。任何帮助都将不胜感激。

df.groupby(['Nationality', 'Position])
.agg({"Score": "AVG"})
.orderBy("Nationality", ascending=True)
.show()

只需在groupby之前插入df.filter(df.Nationality == "USA)即可。

df.filter(df.Nationality == "USA")
.groupby(['Nationality', 'Position'])
.agg({"Score": "AVG"})
.orderBy("Nationality", ascending=True)
.show()

最新更新