用于在My DataFrame R中汇总数据的包



我有一个庞大的数据集,包含了美国1774个县的信息。其中的变量包括收入四分位数、选民偏好、家庭收入中位数等。

我想知道是否有一个方案可以让我快速看到,例如,有多少县的收入超过一定数量并投票支持共和党,或者有多少县超过50%从事服务业,而平均教育程度为HS或更低。

我知道我可以用dplyr函数来实现,但是,当我想用大量变量来实现时,这是非常耗时的。

感谢您的推荐!

我建议您尝试explore包。

虽然您可以手动使用它来探索数据集的特定部分,但它具有其他功能,可以通过shine(explore_shiny(交互式地探索数据,并通过rmarkdown(report(生成整个数据集的报告。

通过将一个变量指定为target并选择第二个变量,可以探索成对的变量(例如,投票支持的政党的收入(。但它不会总是给你所需要的比较。因此,我建议将explore包作为理解数据的初始起点,但对于具体分析,您可能需要编写自己的dplyr、ggplot和/或plotly代码(或您喜欢的任何其他包(。

在其小插曲中可以找到进一步的工作实例。

最新更新