r语言 - 如何从csv文件中获取大数据的一些数据子集(比较csv)?



我有 2 个 csv 文件,第一个 csv 文件有 16749 行,以符号和日志为列。在第一个csv中,它包含一些垃圾数据,这是根本不需要的。 其次,是一个干净的csv文件(没有LOC11*(有14107行,符号只有一列。我想为每个符号 ID 添加它应该从第一个 csv 文件中找到相应的 logFC 值。 我正在打破我的头,编程新手,无法做到。 请帮忙。

Example:
First csv
SYMBOL          log
LOC117745510   -0.35
LOC117741824   -0.54
ipmkb          -0.46
prrc2b
Second csv (log column to be added from 1st csv as reference)
SYMBOL          log
hs6st1a
ipmkb
prrc2b

使用适当的导入函数(如read.csv(读取数据,然后加入它。

library(dplyr)
## read your files (possibly you need to adjust some arguments in read.csv)
file1 <- read.csv("path/to/file1.csv", header = TRUE)
file2 <- read.csv("path/to/file2.csv", header = TRUE)
file2 %>%
left_join(file1, by = "SYMBOL)

最新更新