如何从R中的样本平均值中排除超过2 SD的数据点

我在R中有一个数据帧，如下所示，并希望从样本平均值中排除超过2个SD的数据点。我需要按条件来做。因此，特别是，我需要按条件分组，然后从medErr的平均值中排除超过2个SD的数据点。关于如何做到这一点的任何提示(我使用整洁的诗句，但有点卡住(

谢谢！

年龄条件平均错误医疗错误varErr女性原因<1.545205213>>女性<1.002208099>>女性原因3.1385165875.74271903女性非因果性<1.512882702>1.24308910女性原因-0.4251568920.04519723非因果性0.4339679360.14884018

Nr	ID	性别
1	2143	19	1.589679618	0.93076650
2	21343	19	1.009241219	0.45208960
3	21363	20	2.630161424
4	21363	20	1245398206
5	21368	20	-0.382225350
	21368	女性	20	0.431359690

这样的东西怎么样：

dat %>% 
group_by(Condition) %>% 
mutate(out = case_when(
medErr > mean(medErr, na.rm=TRUE) + 2*sd(medErr, na.rm=TRUE) ~ 1, 
medErr < mean(medErr, na.rm=TRUE) - 2*sd(medErr, na.rm=TRUE) ~ 1, 
TRUE ~ 0)) %>% 
filter(out == 0)

相关内容

最新更新

热门标签：