我是新手,对基本问题感到非常抱歉。
我想根据值的出现次数对分类数据做一个条形图。 它基于谷歌应用商店数据,我想在条形图中查看在例如"游戏"、"艺术与设计"等下出现多少次。 我的问题是有 20 个奇数类别(其中许多类别出现次数为 0 次,因为我选择了性能最佳的应用程序的子集 ["topPerforming"](,所以当我绘制条形图时,它很难阅读,因为它显示了所有类别,包括所有出现次数为 0 的类别。
我想根据表现最好的 5 个类别绘制一个条形图,但我在这样做时遇到了问题。 当我尝试在 5>执行 topPerforming$category 时,我收到一个错误,说"In Ops.factor(topPerforming$Category, 0(:'>'对因素没有意义">
table(topPerforming$Category)
table <- table(topPerforming$Category) # viewing the number of occurences in each category
barplot(prop.table(table(topPerforming$Category)))
任何帮助将不胜感激
好吧,如果没有示例数据集,您可以使用dplyr
链来添加出现次数,然后过滤数据集,也许:
new_data = topPerforming %>% group_by(Category) %>% add_count %>% filter(.,N>5)
如果您有 dput 代码段或示例数据,则应该很容易检查