r语言 - 在 ddply 函数中添加时间趋势变量



我在 ddply 函数中添加时间趋势变量时遇到困难,

以下是简化的代码:

id <- c(1,1,1,2,2,2)
price <- c(1,2,3,2,1,0)
df <- data.frame(id, price)
price_trends <- ddply(df, ~id, summarise, 
mean_price = mean(price), 
sd_price = sd(price))
price_trends

现在我还想包括每个id的时间趋势系数(即id 1的价格倾斜,id 2的价格下降(,但是我很难将其包含在上面的ddply函数中。我感谢任何帮助。

您可以使用:

slope <- function(x) (tail(x,1)-x[1])/length(x)
price_trends <- ddply(df, ~id, summarise, 
mean_price = mean(price), 
sd_price = sd(price),
trend = price %>% slope() %>% round(0))
> price_trends
id mean_price sd_price trend
1  1          2        1     1
2  2          1        1    -1

请注意,如果删除最后一个round(0),则实际上会得到斜率。此外,您可以通过函数定义任何兴趣系数。您还可以直接在ddply中包含该函数,如下所示:

price_trends <- ddply(df, ~id, summarise, 
mean_price = mean(price), 
sd_price = sd(price),
trend = ((tail(price,1)-price[1])/length(price)) %>% round(0)
)
price_trends

最新更新