我有 2 个 STATA 卡方输出,描述了工人性别和就业行业的频率。第一个卡方是针对大学毕业生的样本,第二个样本是经过某种职业课程认证的人。它们都显示 Pr=0.000。
大学毕业生的皮尔逊chi2(14(=123.5285,克莱默V=0.2606。 认证工人的皮尔逊chi2(15(= 437.7627和克莱默的V = 0.4837。
我试图弄清楚这两个分布是否(在统计上(彼此显着不同。任何帮助不胜感激!
我知道你想比较两种不同的分布,你没有函数关系(例如,由理论给出(,只有直方图。你的假设是,对于这两个变量(工人的性别和行业(,相对频率遵循相同的模型,但你确实关心这可能是什么概率分布。柯尔莫哥罗夫-斯米尔诺夫测试将是解决这个问题的好方法。
有一个很好的R博客描述了如何比较两个分布。即使这不一定是您的编程语言,它也可能会有所帮助。在这里,假设略有不同,即他的假设是一个分布比另一个分布更高的 y 值。尽管如此,结构化方法可能会对您有所帮助。
延伸阅读
- https://stats.stackexchange.com/questions/222294/understanding-kolmogorov-smirnov-test-in-r