我正在处理的一些数据帧出现了一个奇怪的错误,将所有行移动了一个单元格,使它们不再与我的数据对应:
而不是这样:
> head(xaa.small)
AGCATTCGAAACATCGAGGCTAACATCCAGTACGCAAGTGGCC AGCATTCGAAACATCGCCAGTTCAATCCATCTTCACAGTGGCC
hg19_ENSG00000000003 0 0
hg19_ENSG00000000419 0 0
hg19_ENSG00000000457 0 0
它看起来像这样:
> head (xab.small)
AGCATTCGAAACATCGAGGCTAACATCCAGTACGCAAGTGGCC AGCATTCGAAACATCGCCAGTTCAATCCATCTTCACAGTGGCC
0 0
hg19_ENSG00000103160 0 0
hg19_ENSG00000103168 0 0
有些数据帧上出现了空白。
我如何擦除它并用R"修复"我的数据帧?还是更有效地导入?fill = True
在导入数据帧时有效,但阻止了我进行进一步的分析。
数据来自一个巨大的tsv文件,该文件被切割成多个部分。也许在切割过程中出现了错误(使用split
功能将初始tsv文件切割成几个200 Mb文件(
我发现了错误:
当最初的文件被切成几块时,它是按字节而不是按行分割的。所以,它有时会在最后一行的最后一列或类似的地方剪切,所以它生成了不完整的行或空白。。。
我只是用split -l (number of lines) file
而不是split -b (number of bytes)
纠正了错误