我正在尝试拟合一个网络到三个模型之一:指数CCD_ 1,指数截尾幂律(P(k)~k^(a-1)e^(k/kc))
和幂定律CCD_ 3。我知道这是一个低信息测试,但我只是想确定三个模型中哪一个最适合(或者可能是最不合适的!)
我在Excel表格中有网络的logCPK
(B列)三个模型(C、D和E列)的拟合值。我有还计算了平方和(SST)(F列),然后三个模型(列G、列H、列B)的误差平方和(SSE),和I)。
对于三个模型中的每一个,我计算了1-(sum(SSE)/sum(SST))
估计每个的简单线性回归的R^2值模型,在Excel底部以黄色突出显示床单所以,现在我有三个R^2值(幂律=0.507,指数=0.77,指数截尾幂律=0.899)
起初,指数截尾幂律似乎是最好的适合(最高R^2值)。然而,我不确定如何解释惩罚指数截尾幂律自由度为2,而其他两个模型的自由度为自由度1。
当我联系另一个在线统计来源时,有人告诉我应该使用"似然比测试"。据我所知最佳拟合的"对数似然性"的负值最小。然而,指数截断幂律似乎具有其"对数似然性"的最小负值(因为它有两个df,另外两个模型只有一个df),所以我必须测试考虑到自由度。
我认为我知道如何在Excel中理论计算的部分:
1) 使用chidist(A,B),其中A是
2*(log.likelihood of Exponentially
truncated - log.likelihood of Power law)
B是df的差值(2-1=1)。如果p值小于0.05,则指数截断确实比幂律更适合。2) 使用chidist(A,B),其中A是
2*(log.likelihood of Exponentially
truncated - log.likelihood of Exponential)
B是df(2-1=1)。如果p值小于0.05,则指数截断确实比Exponential更合适。
然后我可以得出结论,哪种型号最适合。
这就是我的问题所在(取决于我的想法以上是正确的),如何计算log(可能性)?我已经找过了,但仍然不知所措。看起来这种手工计算是一种野兽(除非我能简单地使用我在Excel中已经有了),所以我也在询问软件方面的问题。
另一种选择是计算AIC(也向我建议),尽管我相信我仍然会有同样的问题,我需要计算AIC方程CCD_ 6的log(似然性)。
因此,我的具体问题是如何计算AIC和/或log(可能性)对于这三个模型,可以直接从Excel中获得,也可以使用软件
提前谢谢!
附言:我研究过R编程,发现它有AI{stats}和logLik{stats}函数,但我从文档中不了解无论我是否拥有运行这些功能所需的所有输入信息,如果是,如何运行。
对于幂律,您可以使用以下公式和准则:
Newman MEJ (2005) Power laws, Pareto distributions and Zipf’s law.
Contemporary Physics 46: 323–351. doi:10.1080/00107510500052444.
或者
Xiao X, White E, Hooten M, Durham S (2011) On the use of log-transformation vs.
nonlinear regression for analyzing biological power-laws. Ecology 92: 1887–1894.
doi:10.1890/11-0538.1.
他们有一个在线附录,代码在R 中
之后,您将对如何使用其他发行版有一个更好的想法。