我有两个来自大脑神经元群体的样本,每个样本由一千个神经元实例组成,类别如下:
- 小脑
- 皮层
现在我使用复杂网络分析为每个样本提取多个度量,例如,神经元连接度k
,一个离散数n=0,1。。。。,n、 或聚类系数C
,其连续值在0.00000和1.00000之间。
我的熊猫数据帧中的df.sample(3)
(其中web是类别(:
皮层:
web k clustering_coeff
3080 cortex 6.0 0.733333
2951 cortex 11.0 0.428571
1435 cortex 5.0 0.563571
...
小脑
815 cerebellum 10.0 0.533333
850 cerebellum 9.0 0.416667
1213 cerebellum 7.0 0.454545
...
我如何使用scipy
stats
方法来比较这两个指标,以了解这两种gropus之间是否存在统计学上的显著差异?
假设分布接近高斯,但向右倾斜,我不确定什么是最好的方法。参数化、非参数化、T-检验等。
有什么想法吗?
;k〃;公制:
stats.mannwhitneyu(df.loc[df.web=="cortex", "k"], df.loc[df.web=="cerebellum", "k"])
对于";clustering_coeff";公制:
stats.mannwhitneyu(df.loc[df.web=="cortex", "clustering_coeff"], df.loc[df.web=="cerebellum", "clustering_coeff"])
一般来说,如果你对考试中的分布一无所知,就使用非参数测试。