r语言 - 回归分析或方差分析 - r - Regression analysis or Anova? 小贝子编程网

我希望能做到最清楚。假设我有一个包含 10 个变量的数据集，其中 4 个对我来说代表某种现象，我称之为 Y。对我来说，其他6个代表了另一种现象，我称之为X。

这些变量中的每一个 (10( 包含 37 个单位。这些单位只是我分析(调查(的受访者。由于所有问题都基于李克特量表，因此它们是定性变量。所有这些的刻度都是从 0 到 7，但有"-1"和"-2"值缺少答案。因此，比例实际上从 -2 到 7。

我想做的是计算我的 Y(在本例中包含 4 个变量，每个变量包含 37 个答案(和我的 X(包含 6 个变量和相同数量的受访者(之间的回归。我知道对于定性分析，我应该使用方差分析而不是回归，尽管我在某处读到它甚至是可能的进行回归。

到目前为止，我一直试图这样做：

> apply(Y, 1, function(Y) mean(Y[Y>0])) #calculate the average per rows (respondents) without considering the negative values
> Y.reg<- c(apply(Y, 1, function(Y) mean(Y[Y>0]))) #create the vector Y, thus it results like 1 variable with 37 numbers
> apply(X, 1, function(X) mean(X[X>0]))
> X.reg<- c(apply(X, 1, function(X) mean(X[X>0]))) #create the vector X, thus it results like 1 variable with 37 numbers
> reg1<- lm(Y.reg~ X.reg) #make the first regression
> summary(reg1) #see the results
Call:
lm(formula = Y.reg ~ X.reg)
Residuals:
     Min         1Q       Median      3Q       Max 
-2.26183 -0.49434 -0.02658  0.37260  2.08899 
Coefficients:
               Estimate  Std. Error   t value   Pr(>|t|)    
(Intercept)     4.2577     0.4986     8.539    4.46e-10 ***
 X.reg          0.1008     0.1282     0.786    0.437    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
Residual standard error: 0.7827 on 35 degrees of freedom
Multiple R-squared: 0.01736,    Adjusted R-squared: -0.01072 
F-statistic: 0.6182 on 1 and 35 DF,  p-value: 0.437

但正如你所看到的，虽然我不使用 Y 由 4 个变量组成，X 由 6 组成，而且我也不考虑负值，但我得到的分数非常低，作为我的 R^2。

如果我使用方差分析代替，我会遇到这个问题：

> Ymatrix<- as.matrix(Y)
> Xmatrix<- as.matrix(X) #where both this Y and X are in their first form, thus composed by more variables (4 and 6) and with negative values as well.
> Errore in UseMethod("anova") : 
  no applicable method for 'anova' applied to an object of class "c('matrix', 'integer', 'numeric')"

老实说，几天前我成功地使用了anova，但不幸的是我不记得如何，也没有将命令保存在任何地方。

我想知道的是：

首先，我处理问题的方式是错误的吗？
您如何看待回归输出？
最后，我该怎么做才能制作方差分析？如果我必须这样做。

如果您的响应 (Y( 和预测变量 (x( 是数值刻度，则可以使用回归。如果您的响应 (Y( 是数值尺度，预测变量 (x( 是分类尺度，则可以使用方差分析。

建议：

在使用回归方法之前，您必须使用有效性和可靠性检验来了解响应和预测变量的答案(指标(是否有效和可靠。

我不同意Denny的回答。无论您拥有哪种数据类型，都可以使用任一方法。如果您有分类数据，则可以使用虚拟编码将其表示为数字。例如，给定一个具有 3 个选项(例如 1、2 和 3(的特征 x，您可以通过创建 3 个新的附加变量 x1、x2 和 x3 将其编码为数字。如果 x 为 1，则 x1 将为 1，x2 将为 0，x3 将为零。如果缺少 x，则三个新的 x 值都将为零。

在您的情况下，我建议您先尝试回归，因为您拥有的功能数量众多，而且它往往是直截了当的。随着特征数量的增加，方差分析可能会变得复杂。假设您的数据满足这两种技术要求的假设，这两种方法都应该有效。

r语言 - 回归分析或方差分析

相关内容

最新更新

热门标签：