我有一个大的温度数据集(csv),我必须按日期(年)对其进行子集划分,才能按十年创建5个较小的数据集。因此,1960-1969年的数据将是一个较小的csv文件,1970-1979年的数据则是另一个csv文件等
这样的东西:
IDs<-unique(df$ID)
for (i in 1:length(IDs)){
temp <- df[df$ID==IDs[i],]
#more things to do with temp
}
但我不知道该怎么做。for循环应创建新的csv文件,这些文件已从现有的大型数据集中按日期进行了子集化。
这看起来很普通,因此可以搜索。我在谷歌上搜索了一下,这确实是我发现的第一件事。
http://www.r-bloggers.com/splitting-a-large-csv-file-into-separate-smaller-files-based-on-values-within-a-specific-column/
我试了一下上面列出的剧本,效果很好。试一试,看看你过得怎么样。