lmFit 模型数据集要求



我对R很陌生,并尝试分析一些表达式数组数据。

对于基因表达分析,我们使用线性拟合和eBayes来计算数据。但是,如果我每个条件只有一个样本(例如,1 个对照,1 个实验),我是否仍然可以使用 lmFit/eBayes 函数,或者只是对 MA 结果进行排序以找出顶级基因。是因为计算系数对于每个条件至少需要两个样本吗?

我阅读了利马包装手册。它列出了一些示例。我注意到,在时程实验(第50页)中,案例有两个0hr wt,两个0hr mu,一个6hr wt,一个6hr mu,一个24hr wt和一个24hr mu。 它完成了lmFit/eBayes流程。是因为这是一个时效案例吗?如果我有一个时程数据,其中仍然包含每个条件的一个样本(例如,1 个对照和 1 个实验,分别为 0 小时、6 小时、12 小时和 24 小时),使用 lmFit/eBays 计算系数是否合理?

谢谢!

由于方差为 0,因此在经验贝叶斯平滑(标准误差)中会遇到问题。我尝试了一个玩具示例,这是它给出的错误:

> efit<-eBayes(fit)

Error in ebayes(fit = fit, proportion = proportion, stdev.coef.lim = stdev.coef.lim) : No residual degrees of freedom in linear model fits

是的,时间过程是一个特例。假设表达式随时间平滑变化,并使用回归拟合时间趋势。在所有其他设计中,需要复制才能检测差异表达。

相关内容

最新更新