如何在 QAP 测试中定义样本数量

  • 本文关键字:定义 样本数 测试 QAP r
  • 更新时间 :
  • 英文 :


我经常使用QAP(二次分配过程(检验来检验网络统计的显著性检验,但我从未真正了解样本量的实际含义。网络数量?节点?关系?

我现在正在尝试计算两个网络之间的gcor(在 R 包 statnet 中(的置信区间,并且似乎碰壁了。从我所读到的内容来看,对于(有效(样本量是多少没有普遍的共识。谁能给我任何建议,这应该是什么?

我有两个网络,每个网络有 23 个节点。每个网络中都有不同数量的联系。如果有人对此有任何想法,我将不胜感激!希望这个问题不要太模糊,但我认为一般问题可能适用于许多网络测试。

在图形相关性的情况下,样本大小是邻接矩阵中 {i,j} 个像元的数量,减去对角线。换句话说,它是网络中的总数或潜在联系。换句话说,n * (n - 1( 或 [n * (n - 1(]/2(如果无定向(,其中 n 是节点数。 gcor评估每对是否存在平局之间的相关性。

> g1 <- rgraph(10)
> g2 <- rgraph(10)
> gcor(g1,g2)
[1] -0.0784586
> vg1 <- gvectorize(g1, censor.as.na = F) #This creates a vector of all non-diagonal pairs in the network, with 0 or 1
> vg2 <- gvectorize(g2, censor.as.na = F)
> cor(vg1,vg2) #Good old fashioned Pearson correlation
[1] -0.0784586
在这里的特定情况下,23 * (23 -1( =

506 或 [23 * (23 -1(]/2 = 253。

但是,如果您

使用的是 QAP,则为相关性构建置信区间完全是另一回事。QAP 是非参数检验,因此在正态置信区间构造中使用的临界值(通常为 ±1.96(不合适。

另请注意,还有其他情况,特别是对于图形级统计,其中样本大小基本上为 1,因为统计量是整个网络的属性。(如果您正在比较网络,则为 2!

最新更新