sqldf:如何根据类别对子类别进行分组



>我有一个包含 15 条记录的 csv 文件,其中包含类别/子类别。

列数:Main_category,Sub_category,计数
期望结果:类别,Sub_cat1,50

我用Python熊猫尝试了一下,得到了上面的结果:

test = pd.DataFrame(df.groupby(['Main_category','Sub_category']['Sub_category'].count())

我正在尝试在 R 中使用 sqldf 实现相同的目标,但没有获取类别的每个子类别的计数。它只显示总数:

sqldf("select Main_category, Sub_category, count(*) from MyData group by Main_category")

如果我只看一下SQL查询,似乎你必须按聚合维度(Main_categorySub_category)进行分组,以便SQL查询甚至可以在大多数SQL语言中编译:

sqldf("select Main_category, Sub_category, count(*) from MyData group by Main_category, Sub_category")

相关内容

  • 没有找到相关文章

最新更新