如何在 QAP 测试中定义样本数量

我经常使用QAP(二次分配过程(检验来检验网络统计的显著性检验，但我从未真正了解样本量的实际含义。网络数量？节点？关系？

我现在正在尝试计算两个网络之间的gcor(在 R 包 statnet 中(的置信区间，并且似乎碰壁了。从我所读到的内容来看，对于(有效(样本量是多少没有普遍的共识。谁能给我任何建议，这应该是什么？

我有两个网络，每个网络有 23 个节点。每个网络中都有不同数量的联系。如果有人对此有任何想法，我将不胜感激！希望这个问题不要太模糊，但我认为一般问题可能适用于许多网络测试。

在图形相关性的情况下，样本大小是邻接矩阵中 {i，j} 个像元的数量，减去对角线。换句话说，它是网络中的总数或潜在联系。换句话说，n * (n - 1( 或 [n * (n - 1(]/2(如果无定向(，其中 n 是节点数。 gcor评估每对是否存在平局之间的相关性。

> g1 <- rgraph(10)
> g2 <- rgraph(10)
> gcor(g1,g2)
[1] -0.0784586
> vg1 <- gvectorize(g1, censor.as.na = F) #This creates a vector of all non-diagonal pairs in the network, with 0 or 1
> vg2 <- gvectorize(g2, censor.as.na = F)
> cor(vg1,vg2) #Good old fashioned Pearson correlation
[1] -0.0784586

在这里的特定情况下，23 * (23 -1( =

506 或 [23 * (23 -1(]/2 = 253。

但是，如果您

使用的是 QAP，则为相关性构建置信区间完全是另一回事。QAP 是非参数检验，因此在正态置信区间构造中使用的临界值(通常为 ±1.96(不合适。

另请注意，还有其他情况，特别是对于图形级统计，其中样本大小基本上为 1，因为统计量是整个网络的属性。(如果您正在比较网络，则为 2！

相关内容

最新更新

热门标签：