需要帮助使用sas查找纵向数据中的异常值



我有一个学生教室,每周都会进行考试。我希望随着时间的推移,测试结果会有所改善。我想将表现不佳的人确定为使用SAS未随着时间的推移而改善的异常值(有9.2)。此外,是否有公认的标准可以作为部分时间间隔而非整个时间间隔的异常值?这是我目前的大部分代码(还没有寻找异常值,只是纵向分析):

proc mixed data= XYZ_LONG ;
title1 'XYZ Analysis';
class group day subject ;
model TV = group day group*day / ddfm=satterthwaite;
repeated day / type = cs sub = subject ;

我不认为你对"表现不佳"的定义是对异类的定义。但是:

如果你想找到那些没有随着时间的推移而改善的人,这很容易,但你必须更准确地定义它。在任何两周之间没有改善?第一周和最后周?还有别的吗?

你所说的"没有改善"到底是什么意思?你的意思是字面意思吗(以后分数相同还是更差?)

在任何一种情况下,我都会使用一个数组,找到差异分数,然后确定负的差异分数(或者你想要的任何分数)。

然而,如果你要做建模,那么可能应该根据该模型来定义一个异常值——也就是说,在你的模型中,对组进行核算。但是,如果你有很多异常值,而且它们不是坏数据,你不应该把这些人赶出去,而是使用更好的模型。

相关内容

  • 没有找到相关文章

最新更新