用于在My DataFrame R中汇总数据的包

我有一个庞大的数据集，包含了美国1774个县的信息。其中的变量包括收入四分位数、选民偏好、家庭收入中位数等。

我想知道是否有一个方案可以让我快速看到，例如，有多少县的收入超过一定数量并投票支持共和党，或者有多少县超过50%从事服务业，而平均教育程度为HS或更低。

我知道我可以用dplyr函数来实现，但是，当我想用大量变量来实现时，这是非常耗时的。

感谢您的推荐！

我建议您尝试explore包。

虽然您可以手动使用它来探索数据集的特定部分，但它具有其他功能，可以通过shine(explore_shiny(交互式地探索数据，并通过rmarkdown(report(生成整个数据集的报告。

通过将一个变量指定为target并选择第二个变量，可以探索成对的变量(例如，投票支持的政党的收入(。但它不会总是给你所需要的比较。因此，我建议将explore包作为理解数据的初始起点，但对于具体分析，您可能需要编写自己的dplyr、ggplot和/或plotly代码(或您喜欢的任何其他包(。

在其小插曲中可以找到进一步的工作实例。

相关内容