使用SPSS中的分割变量统计病例

我有一个SPSS数据集，包含5000多个案例，如下所示：

ID, relation to head of household
1, head of household
1, son
1, partner
2, head of household
2, son
3, head of household
3, son
3, cousin

我需要统计有的家庭数量

户主+子女
户主+伴侣+子女
户主+亲属
户主+伴侣+亲属

我知道这应该使用ID作为分段变量来完成，但不知道如何做到。

一种方法是为每个类别创建一组伪变量，然后使用AGGREGATE来获取家庭级别的统计数据。

DATA LIST LIST (",") /ID (F1.0) Relation (A20).
BEGIN DATA
1,head of household
1,son
1,partner
2,head of household
2,son
3,head of household
3,son
3,cousin
END DATA.
DATASET NAME Houses.
*Making dummy variables.
COMPUTE HeadHouse = (Relation = "head of household").
COMPUTE Partner = (Relation = "partner").
COMPUTE Child = (Relation = "son").
COMPUTE Relative = (Relation = "cousin").
DATASET DECLARE AggHouse.
AGGREGATE OUTFILE='AggHouse'
  /BREAK ID
  /HeadHouse = SUM(HeadHouse)
  /Partner = SUM(Partner)
  /Child = SUM(Child)
  /Relative = SUM(Relative).

然后，使用聚合数据集，您可以随后使用IF语句来计算所需的条件。例如

DATASET ACTIVATE AggHouse.
IF (HeadHouse > 0) AND (Child > 0) First = 1.
IF (HeadHouse > 0) AND (Partner > 0) AND (Child > 0) Second = 1.

对于真实的数据集，您需要为这两个原始的伪变量集插入更多的条件，但我将此作为练习留给您。

相关内容

最新更新

热门标签：