r-如何解释Seurat对象中nCount_RNA的十进制值



我的数据集非常奇怪。当我创建Seurat对象并加载它的元数据时,nCount_RNA中的所有值都是十进制值,而不是整数。我应该如何解释?数据本身有问题吗?或者我可以做些什么来解决这个问题?我之所以这么问,是因为在稍后的分析中,函数似乎找不到nCount_RNA对象,我相信十进制值是原因。

Seurat对象的元数据

这是我用来创建这个对象的代码:

#Loading in the data ----------------------------------------------------------
filePaths = getGEOSuppFiles("GSE124395") 
tarF <- list.files(path = "./GSE124395/", pattern = "*.tar", full.names = TRUE) 
untar(tarF, exdir = "./GSE124395/") 
gzipF <- list.files(path = "./GSE124395/", pattern = "*.gz", full.names = TRUE) 
ldply(.data = gzipF, .fun = gunzip) 

# Creating the matrix -----------------------------------------------------------
P301_3_matrix <- read.delim(file = './GSE124395//GSM3531672_P301_3_CRYOMIXED11.coutt.csv') 
P301_3_matrix <- data.frame(P301_3_matrix[,-1], row.names=P301_3_matrix[,1]) 
P301_3_matrix <- as.matrix(P301_3_matrix) #<- makes the excel file into a matrix 
P301_3_colname <- read.table(file = './GSE124395//GSE124395_celseq_barcodes.192.txt', header = FALSE, row.names = 1) 
P301_3_colname <- data.frame(P301_3_colname[,-1], col=P301_3_colname[,1]) 
P301_3_colname <- as.matrix(P301_3_colname) 
colnames(P301_3_matrix) <- P301_3_colname[,1] 
colnames(P301_3_matrix) <- paste(colnames(P301_3_matrix), "CryoMixed11", sep = "_") 
P301_3_pdat <- data.frame("samples" = colnames(P301_3_matrix), "treatment" = "CryoMixed") 

#Creating the Seurat object ----------------------------------------------------
sobj<- CreateSeuratObject(counts = P301_3_matrix, min.cells = 0, min.features=1, project = "Liver_Cell_Atlas")
sobj <- saveRDS(sobj,file="JoinedMatrixNoFilters.rds")

希望这不是太模糊,感谢阅读!

您读入的文件,它以某种方式进行了规范化,并且绝对不是计数数据:

P301_3_matrix = read.delim('GSM3531672_P301_3_CRYOMIXED11.coutt.csv.gz',row.names=1)
head(colSums(P301_3_matrix))
X1         X2         X3         X4         X5         X6 
205.2744 22457.6142  1232.4626 14193.6406 15372.4642 18808.8838 

如果你阅读有关处理的详细信息,它会写道:

基于二项式统计,观察到的UMI数量为转化为转录物计数(Grün等人,2014(

因此,很可能您必须向作者索要计数表,或者简单地转换为整数,然后继续,希望没有任何问题。

最新更新