在SPSS中创建和使用多个数据集



请原谅这个可能很天真的问题,但尽管我有数据库方面的经验,但我对SPSS还是个新手,可能忽略了一些简单的东西。

我有关于患者的数据(唯一的pt标识符、年龄、性别等(

患者进行多种不同类型的测试,每种测试可能需要几百到几千个字段(唯一的pt标识符、测试类型、测试日期、测试数据1、测试数据2…测试数据2000(。我有这些测试结果的大量数据集。

我想计算一下测试结果,但这些计算有时需要参考患者的特性。我知道我可以向测试数据集添加列,将患者数据添加到每一行,但这似乎很尴尬和多余(患者多次接受相同类型的测试,所以我最终会多次添加相同的信息(。

这在概念上似乎很简单,但除非我只是使用了错误的术语,否则我在SPSS命令语法或多个网络搜索中都找不到任何关于这方面的信息。如果指向正确的文档,很乐意阅读。

非常感谢。

在SPSS中,您需要将所有想要交互的数据放在同一数据集中。所以,是的,你必须把病人的特性和测试结果放在同一个数据集中。如果这导致了(太(大的数据集,那么有两种简单的方法可以用较小的数据集获得所需:首先,你不一定要把所有的测试结果和所有的患者属性放在一起,只需要把每个分析的相关结果放在一起。例如:

match files /file=testresults /table=patients /by=patientID 
/keep=patientID test1 test2 property1 property2.
exe.
dataset name dataForAnalysis1.

第二种方法是首先将测试数据聚合到患者级别,然后才匹配数据集。

dataset activete testdata.
dataset declare agg1.
aggregate out=agg1 /break patientID /test1 test2=mean(test1 test2).
match files /file=agg1 /table=patients /by patientID.
exe.
dataset name dataForAnalysis1.

最新更新