试图比较R中两类不同的变量

  • 本文关键字:两类 变量 比较 r plot
  • 更新时间 :
  • 英文 :


我在一个数据集中工作,其中一些变量是字符,另一些是数字。在数以万计的观测中,有些已经获得了资金来进行一个项目。Project是一个角色变量,有不同的几个不同的选项,这取决于他们所做的项目;有些观察结果在该栏中只是"无"。

我试图在Project变量中运行一些关于不同可能性的基本统计数据。以及运行一些绘图,以查看不同的项目接受者与数据集中的其他变量相比的位置,这些变量大多是数值协变量。

例如,我的一段代码是plot((Housing_Data$Project), (Housing_Data$Size));但我得到了一个糟糕的可视化,因为我不知道如何一次查看一种类型的项目的观察结果。

有人能告诉我如何做等效的(Housing_Data$Project, = "None")吗?或者类似的东西?

方框图怎么样?

boxplot(Size ~ Project, data=Housing_Data)

或者针对单个项目:

boxplot(Size ~ Project, data=Housing_Data, subset=Project == "None")

如果Project是一个"因子",则上述命令仍将显示所有级别,但不显示任何数据。为了防止这种情况,请将其转换为"字符":

Housing_Data$Project <- as.character(Housing_Data$Project)
boxplot(Size ~ Project, data=Housing_Data, subset=Project == "None")

最新更新