手动更改.bgen附带的.sample文件:如何导出带有两个"标题行"的.txt文件从R ?<



我不得不手动更改随我输入的基因型数据(存储在.bgen中)而来的bgen .sample文件,因为它缺少性别信息(所有NAs),然后我分别用男性和女性的15和2s填充。plink不会让我运行我的数据原样附带的原始.sample文件,因为在性别列中有NAs,我得到Error: Invalid sex code on line 3 of .sample file.

但是,我遇到了问题。

我保存了我的"new".sample文件首先作为.txt文件在R中使用:

write.table(samples, file = "samples_bgen.txt", sep = " ", row.names = FALSE, quote=FALSE, col.names = TRUE)

这个.txt输出有26,623行。列名是第一个标题(ID_1,ID_2,missing,sex),第一行是应该是第二个标题行(0, 0, 0, D)。然后我手动将其从.txt更改为.sample(因为我不确定还能做什么。)

当我运行plink:

plink --bgen data.bgen --sample samples_bgen.sample --make-bed --out data_output

我得到"Error: --bgen and --sample files contain different numbers of samples.">

我有26,622个样本在我的主文件data.bgen。示例文件中有一个额外的行,因为第一行需要作为第二个标题行。如果我手动删除第二行(000D),那么我得到错误消息Error: Invalid second header line in .sample file.

那么:我如何把第二行变成第二行标题呢?任何帮助都将非常感激。我一直在挖掘在网络没有多少运气到目前为止。谢谢你!

我在.sample中也遇到了一些问题(似乎plink2无法识别.sample文件中father/mother列中的id),所以我决定删除.sample中的两列。我做了与您类似的事情,但在最后一步中,我使用Mac命令行cp xxx.txt yyy.sample将修改后的.txt转换为.sample。修改后的.sample工作时没有任何错误/警告。但是我不确定这样修改.sample是否可以。

相关内容