子集 PLINK 二进制文件 (BED, BIM & FAM)



大家好,我正在研究基因型数据,我有bed, him和fam文件,其中包含GWAS的汇总统计数据。因为个体的数量很多,所以我想从二进制文件中随机抽取3000个样本。换句话说,我想要二进制文件的子集。你知道怎么用plink, R或者python吗?

您可以使用PLINK来实现。首先,创建一个您想要子集的个人列表,并将其命名为individuals.txt。接下来,运行以下命令为individuals.txt

中的个人创建一个单独的二进制文件plink --bfile toy --keep individuals.txt --make-bed --out toy_subset

希望对你有帮助。

最新更新