如何在分位数回归中找出不同分位数的系数是否显著不同?(SPSS或Python)



我正在研究某一职业的收入增长率在收入分配的不同部分是否存在显著差异,以了解收入差距是否在显著扩大或缩小。

QUANTREG模型

我在SPSS中进行了分位数回归(我是编码新手,只掌握了Python的基本知识,所以我需要你的帮助(。因变量是指数收入,自变量是时间(本数据集中的季度(、人口统计群体、职业细分。我还添加了每个假人与时间变量的交互项。

因此(至少在我看来(,这个模型允许在三个层面上比较收入的变化:

  1. 属于某一人口群体或细分市场如何影响收入(例如,与数据录入工作相比:数据分析增加100欧元,数据科学增加200欧元(
  2. 每个不同类别/假人的影响如何随着时间的推移而变化(例如,与数据录入工作相比,作为数据科学家的积极影响增加了10%,现在增加了220欧元(
  3. 这些变化的影响在收入分配的不同部分之间有何不同(例如,时间系数*data_scientist在90%的Q中比在10%的Q中大得多,这表明收入较高的数据科学家的收入随着时间的推移比收入较低的数据科学家有更大的增长(

问题

所以我在SPSS上得到了这个分位数回归的结果,这是一个巨大的表格,里面有所有的系数、它们的显著性和置信区间。

现在我想弄清楚90%的Q和10%的Q之间的差异是否具有统计学意义,以便说明这个职业的收入差距是显著增加还是减少。我想用Python而不是SPSS来做这件事,我已经研究了如何将数据划分为分位数,以及如何执行分位数回归。但是,人们应该如何继续测试90%Q和10%Q之间差异的显著性呢?

我找到了一种方法来测试回归系数是否有显著差异,50%规则使用标准化的β权重及其95%置信区间(可以通过偏差校正的bootstrap进行估计;对于分位数回归,它们通常已经在输出中提供(。该规则基本上规定,如果两个样本均值的95%置信区间重叠小于50%,则存在显著差异(p=0.05(。如果重叠小于14%,则显著性水平为p=0.01。

这是Youtube视频,我在其中发现了这种方法:

https://www.youtube.com/watch?v=qKnpiGwNDMk

Youtube视频提到的论文:

Cumming,G.(2009(。通过眼睛推断:读取置信区间的重叠医学统计学,28(2(,205-220。

最新更新