小贝子编程

r语言 - 如何从csv文件中获取大数据的一些数据子集(比较csv)？

本文关键字：csv 数据比较子集获取 r语言文件 r bash
更新时间 : 2023-09-17
英文 : r - How to get some subset of data from a csv file for big-data(comparing csv's)?

我有 2 个 csv 文件，第一个 csv 文件有 16749 行，以符号和日志为列。在第一个csv中，它包含一些垃圾数据，这是根本不需要的。其次，是一个干净的csv文件(没有LOC11*(有14107行，符号只有一列。我想为每个符号 ID 添加它应该从第一个 csv 文件中找到相应的 logFC 值。我正在打破我的头，编程新手，无法做到。请帮忙。

Example:
First csv
SYMBOL          log
LOC117745510   -0.35
LOC117741824   -0.54
ipmkb          -0.46
prrc2b
Second csv (log column to be added from 1st csv as reference)
SYMBOL          log
hs6st1a
ipmkb
prrc2b

使用适当的导入函数(如read.csv(读取数据，然后加入它。

library(dplyr)
## read your files (possibly you need to adjust some arguments in read.csv)
file1 <- read.csv("path/to/file1.csv", header = TRUE)
file2 <- read.csv("path/to/file2.csv", header = TRUE)
file2 %>%
left_join(file1, by = "SYMBOL)

r语言 - 如何从csv文件中获取大数据的一些数据子集(比较csv)？

相关内容

最新更新

热门标签：