如何使用两个样本t检验计算R中每个特征的p值



我有两个数据帧案例和控件,我执行了两个示例t检验。想要计算每个功能的p值。基于为每个功能生成的p值,我要拒绝或接受零假设。

任何人都可以向我解释如何解释以下输出以及如何计算每个功能的p值?

t.test(New_data_zero,New_data_one)
    Welch Two Sample t-test
data:  New_data_zero_pca and New_data_one_pca
t = -29.086, df = 182840000, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.02499162 -0.02183612
sample estimates:
 mean of x  mean of y 
0.04553462 0.06894849 

看?t.t.test。x和y应该是向量而不是矩阵。因此该函数将自动将其转换为向量。假设列是功能,并且两个矩阵具有相同的功能,则您想做的是:

pvals=vector()
for (i in seq(ncol(New_data_zero))){
 pvals[i]=t.test(New_data_zero[,i], New_data_one[,i])$p.value
}

然后,您可以查看PVALS(可能是日志量表)和多个假设测试校正之后(请参阅?P. adjust)。

让我们还讨论这种方法在您的功能之间找到差异的极为错误的想法。即使这1299个功能之间的所有效果实际上为零,您也会发现 *在所有可能的1299 2向比较中,有0.05个显着结果,这使得该策略有效地毫无意义。我强烈建议您查看介绍性统计文本,尤其是在继续进行的家庭型错误率的部分。

最新更新