我是一个R初学者。我想使用"DescTools"包的trim函数来修剪变量。使用:
就可以了mydata <- data.frame(
a <- rnorm(40, mean = 0, sd = 1)
)
a_trim <- Trim(mydata$a, trim = 0.2, na.rm = TRUE)
这创建了一个对象,但是,我想将它添加到我的数据框架mydata。当我尝试通过
mydata$a_trim <- Trim(mydata$a, trim = 0.2, na.rm = TRUE)
R给了我一个错误,因为mydata$a_trim的行数少于数据框(显然,因为它是一个修剪过的变量)。我该怎么做呢?
感谢您的耐心和帮助!
Trim
不适合你想做的事情。它从向量中删除极值,以便您可以将该向量传递给mean
或sd
之类的东西,以便在不受异常值影响的情况下计算这些量。
可以使用quantile
设置极值为NA。
upper_quantile <- quantile(mydata$a, 0.9)
lower_quantile <- quantile(mydata$a, 0.1)
# col a where a > its 90th percentile becomes NA
mydata$a[mydata$a > upper_quantile] <- NA
mydata$a[mydata$a < lower_quantile] <- NA
反映这篇文章,我改变了函数Trim
,以返回被修剪元素的索引作为属性"trim"
。现在,您仍然会得到修剪后的向量,但是如果您只是想标记要修剪的元素,您可以这样做:
a <- rnorm(40, mean = 0, sd = 1)
a_trim <- Trim(mydata$a, trim = 0.2, na.rm = TRUE)
data.frame(x=a,
trim=is.element(seq_len(length(a), attr(a_trim, "trim")))
(from DescTools 0.99.18)