读取数据后,我习惯于以下脚本:
for sample in record.samples:
print(type(sample))
我得到:
<class 'vcf.model._Call'>
有了这个:
print(sample)
我得到:
Call(sample=MA605, CallData(GT=0/0, AD=[13, 0], DP=13, GQ=0, PB=None, PC=None, PG=0/0, PI=None, PL=[0, 0, 228], PW=0/0))
Call(sample=MA611, CallData(GT=0/0, AD=[57, 0], DP=57, GQ=0, PB=None, PC=None, PG=0/0, PI=None, PL=[0, 0, 1369], PW=0/0))
Call(sample=MA622, CallData(GT=0/1, AD=[67, 14], DP=81, GQ=99, PB=None, PC=None, PG=0/1, PI=None, PL=[229, 0, 2535], PW=0/1))
Call(sample=MA625, CallData(GT=0/0, AD=[58, 0], DP=58, GQ=0, PB=None, PC=None, PG=0/0, PI=None, PL=[0, 0, 590], PW=0/0))
Call(sample=MA629, CallData(GT=1|0, AD=[24, 5], DP=29, GQ=67, PB=.,., PC=1.0, PG=1|0, PI=5060, PL=[67, 0, 952], PW=1|0))
Call(sample=Ncm8, CallData(GT=0/0, AD=[7, 0], DP=7, GQ=0, PB=None, PC=None, PG=0/0, PI=None, PL=[0, 0, 147
我正在尝试使用以下方法将输出写入文件:
output.write("{}t{}t{}t{}t{}"
.format(contig1, pos1, ref_allele1, all_alleles1, all_freq1))
for sample in record.samples:
output.write("t{}t{}".format(sample['GT'], sample['PI']))
一切正常,但我有一些行缺少PI
字段 - 这意味着PI
完全丢失并且不是(PI = None
)。当我的脚本达到该行时,我得到AttributeError
:
Traceback (most recent call last):
File "/home/everestial007/PycharmProjects/stitcher/pHASE-Stitcher-Markov/pHASE-Stitcher_stage01-4_nonInteractive-MarkovModel.py", line 221, in <module>
phase_block_index = record.genotype('2ms02g')['PI']
File "/home/everestial007/anaconda3/lib/python3.5/site-packages/vcf/model.py", line 104, in __getitem__
return getattr(self.data, key)
AttributeError: 'CallData' object has no attribute 'PI'
当PI
值不在我的数据中时,如何将它设置为 .
( record.sample
)?
我尝试了几种方法。我可行的方法之一是:
output.write("t{}t{}".format(sample['GT'] or None, sample['PI'] or None))
但是,仍然失败。
任何,建议。
谢谢
你可以试试sample.get('PI') or '.'
。
获取返回值默认为 None
,当未定义键时。