使用R指定row.name打开CSV文件时出错

我有一个大df(CSV格式(，看起来像：

miRNAs <- c('mmu_mir-1-3p','mmu_mir-1-5p','mmu-mir-6-5p','mmu-mir-6-3p')
cca <- c('12854','5489','54485','2563')
ccb <- c('124','589','5465','25893')
taa <- c('12854','589','5645','763')
df <- data.frame(miRNAs,cca,ccb,taa)

我想在DESeq2分析中使用这个df。我使用unique(df)使这个df唯一，并尝试使用countData <- as.matrix(read.csv(file="df.csv", row.name="miRNAs", sep = ","))打开，但它给出了这个错误

read.table中的错误(file=file，header=header，sep=sep，quote=quote，：不允许重复的"row.names">

由于我制作了dfunique，我不知道为什么这个错误不断出现。基本上，我想以这种方式读取df的原因是，当我键入colnames(df)时，我想获得列标题(except the first column)的列表。因为我需要做FALSE-TRUE测试，看看这些是否与另一个名为phenetype.csvall(rownames(phenotype) == colnames(countData))的文件的行名匹配

在row.name="miRNAs"参数中，您没有访问相应的列，而是使用长度为一个字符的向量。然后被回收，这就是为什么你会得到错误。导入时不带row.names参数，如果您真的希望该变量作为行名而不是列，则在导入后执行此操作：

df <- data.frame(
miRNAs = c('mmu_mir-1-3p','mmu_mir-1-5p','mmu-mir-6-5p','mmu-mir-6-3p'),
cca = c('12854','5489','54485','2563'),
ccb = c('124','589','5465','25893'),
taa = c('12854','589','5645','763')
)
rownames(df) <- df$miRNAs
df$miRNAs <- NULL
df
#>                cca   ccb   taa
#> mmu_mir-1-3p 12854   124 12854
#> mmu_mir-1-5p  5489   589   589
#> mmu-mir-6-5p 54485  5465  5645
#> mmu-mir-6-3p  2563 25893   763

^{创建于2020-02-19由reprex包(v0.3.0(}

相关内容

最新更新

热门标签：