从r中的zip文件夹下载并保存特定文件



我将下载以"s_";从url中的zip目标";https://genelab-data.ndc.nasa.gov/geode-py/ws/studies/GLDS-87/download?source=datamanager&file=GLDS-87_ metadata_Zanello_ST135-ISA.zip";。稍后,我需要下载许多这样的数据集,但其中唯一常见的是目标文件以"开头;s〃;。目前我只有以下代码:

temp <- tempfile()
download.file("https://genelab-data.ndc.nasa.gov/geode-py/ws/studies/GLDS-87/download?source=datamanager&file=GLDS-87_metadata_Zanello_STS135-ISA.zip", temp)

你能指导我如何完成我的代码以获得唯一以"开头的文件吗;s_";?

这里有一种方法。

  1. 获取.zip文件中文件的名称
  2. 使用grep搜索目标文件名
  3. 提取目标文件

获取zip文件名。

fl <- list.files(pattern = "GLDS")
fl
#[1] "GLDS-87_metadata_Zanello_STS135-ISA.zip"

现在按照上面的步骤提取目标文件。

files_list <- unzip(fl, list = TRUE)
str(files_list)
#'data.frame':  3 obs. of  3 variables:
# $ Name  : chr  "s_Zanello.txt" "a_zanello_transcription_profiling_DNA_microarray.txt" "i_Investigation.txt"
# $ Length: num  7138 6535 11233
# $ Date  : POSIXct, format: "2020-09-25 11:25:00" "2020-09-25 11:25:00" ...
i <- grep("^s_", files_list$Name)
unzip(fl, files = files_list$Name[i])
list.files(pattern = "^s_")
#[1] "s_Zanello.txt"

相关内容

  • 没有找到相关文章

最新更新