我在一个数据集中工作,其中一些变量是字符,另一些是数字。在数以万计的观测中,有些已经获得了资金来进行一个项目。Project是一个角色变量,有不同的几个不同的选项,这取决于他们所做的项目;有些观察结果在该栏中只是"无"。
我试图在Project变量中运行一些关于不同可能性的基本统计数据。以及运行一些绘图,以查看不同的项目接受者与数据集中的其他变量相比的位置,这些变量大多是数值协变量。
例如,我的一段代码是plot((Housing_Data$Project), (Housing_Data$Size))
;但我得到了一个糟糕的可视化,因为我不知道如何一次查看一种类型的项目的观察结果。
有人能告诉我如何做等效的(Housing_Data$Project, = "None")
吗?或者类似的东西?
方框图怎么样?
boxplot(Size ~ Project, data=Housing_Data)
或者针对单个项目:
boxplot(Size ~ Project, data=Housing_Data, subset=Project == "None")
如果Project
是一个"因子",则上述命令仍将显示所有级别,但不显示任何数据。为了防止这种情况,请将其转换为"字符":
Housing_Data$Project <- as.character(Housing_Data$Project)
boxplot(Size ~ Project, data=Housing_Data, subset=Project == "None")