如何使用Python为每个SNP生成随机浮点数



我正在处理GWAS数据,这里我有一个列名称SNP_Id,这是200万行,我需要为每个SNP_Id生成随机浮动值!怎么做呢?

Input_Data:
SNP_Id
200610-10
200610-108
200610-109
200610-116
200610-118
200610-125
.
.

像这样,我有2M行

Desired Output:
200610-10, 8.9
200610-108, 90.9
200610-109, 76.9
200610-116, 728.9
200610-118, 646.9
200610-125, 766.9
.
.

我试过了:

with open('SNP.csv') as f:
reader = csv.reader(f)
for row in reader:
snp_list = np.random.random(0, len(SNP.csv))

但是没有用,告诉我我做错了什么?

您可以使用numpy,其中df1是包含GWAS snp数据的数据框,如下所示,

import numpy as np
df1['randNumCol'] = np.random.uniform(0,len(df1), size=len(df1))

选自1.

相关内容

  • 没有找到相关文章

最新更新