我有一个带有基因名称的向量,其中向量中的几个元素包含多个基因名称,用逗号分隔。我怎样才能把这个向量的元素分开,得到一个长向量,每个基因的名字作为向量的一个单独的元素?我试过strsplit,但那只是给我两个或更多的基因名称作为分开的字符串,但仍然在向量的相同元素…/>
genes = c("PGD", "CDA", "MROH7,TTC4", "PGM1")
,我想把元素"MROH7,TTC4"
分成两个元素"MROH7"
和"TTC4"
这将在每个逗号处拆分字符串:
genes = c("PGD", "CDA", "MROH7,TTC4", "PGM1")
genes.split = unlist(strsplit(genes, ","))
genes.split
[1] "PGD" "CDA" "MROH7" "TTC4" "PGM1"
另一个选项是scan
,它也会占用空白。
scan(text=genes, what='', sep=',', strip.white=TRUE)