我有一个数据集在许多天内拥有24小时的太阳能发电,现在我必须找到根据时间生成的电源的平均值,例如,请瞥见数据集必须找到时间9:00:00 AM生成的电源的平均值。
首先从日期时间变量中删除时间。
假设您的数据称为mydata
library(lubridate)
myData$Hour <- hour(strptime(myData$Time, format = "%Y-%m-%d %H:%M:%S"))
然后使用plyr
软件包中的ddply
,该软件包允许我们将函数应用于数据子集。
myMeans <- ddply(myData[,c("Hour", "IT_solar_generation")], "Hour", numcolwise(mean))
由此产生的框架将有一个名为"时间"的列,该列将为您提供小时,而在每个小时的平均值。
现在,在另一方面但重要的是,当您提出一个问题时,您应该提供有关您到目前为止尝试回答问题的尝试的信息。这不是服务台。