我有一个大于20000
行的数据集,由于其上传到20000
的总行数限制,我无法将其导入到SharePoint
。共有17
列,并且它们中的每一个都具有总计为113798
的6694
行。
因此,我想将这个xlsx
文件拆分成更小的文件,总行数小于20000
。
我该怎么做?
样本数据:
df2 <- data.frame(a = seq(1,6694), b = seq(1,6694), c = seq(1,6694),
d = seq(1,6694), e = seq(1,6694), f = seq(1,6694),
g = seq(1,6694), h = seq(1,6694), i = seq(1,6694),
k = seq(1,6694), l = seq(1,6694), m = seq(1,6694),
n = seq(1,6694), o = seq(1,6694), p = seq(1,6694),
q = seq(1,6694), replace = T)
我们可以使用gl
创建split
的分组索引,将大数据分组到数据集的list
,每个数据集有20000行(如果整个数据行数不是20000的倍数,则最后一个列表元素将具有剩余的行数(
n <- 20000
lst1 <- split(df2, as.integer(gl(nrow(df2), n, nrow(df2))))