如何分割向量与字符串



我有一个带有基因名称的向量,其中向量中的几个元素包含多个基因名称,用逗号分隔。我怎样才能把这个向量的元素分开,得到一个长向量,每个基因的名字作为向量的一个单独的元素?我试过strsplit,但那只是给我两个或更多的基因名称作为分开的字符串,但仍然在向量的相同元素…/>

genes = c("PGD", "CDA", "MROH7,TTC4", "PGM1") 

,我想把元素"MROH7,TTC4"分成两个元素"MROH7""TTC4"

这将在每个逗号处拆分字符串:

genes = c("PGD", "CDA", "MROH7,TTC4", "PGM1")
genes.split = unlist(strsplit(genes, ","))
genes.split
[1] "PGD"   "CDA"   "MROH7" "TTC4"  "PGM1" 

另一个选项是scan,它也会占用空白。

scan(text=genes, what='', sep=',', strip.white=TRUE)

最新更新