我正在尝试使用snakemake制作一个简单的管道,从Web下载两个文件,然后将它们合并为一个输出。
我认为可以工作的是以下代码:
dwn_lnks = {
'1': 'https://molb7621.github.io/workshop/_downloads/sample.fa',
'2': 'https://molb7621.github.io/workshop/_downloads/sample.fa'
}
import os
# association between chromosomes and their links
def chromo2link(wildcards):
return dwn_lnks[wildcards.chromo]
rule all:
input:
os.path.join('genome_dir', 'human_en37_sm.fa')
rule download:
output:
expand(os.path.join('chr_dir', '{chromo}')),
params:
link=chromo2link,
shell:
"wget {params.link} -O {output}"
rule merger:
input:
expand(os.path.join('chr_dir', "{chromo}"), chromo=dwn_lnks.keys())
output:
os.path.join('genome_dir', 'human_en37_sm.fa')
run:
txt = open({output}, 'a+')
with open (os.path.join('chr_dir', "{chromo}") as file:
line = file.readline()
while line:
txt.write(line)
line = file.readline()
txt.close()
此代码返回错误: No values given for wildcard 'chromo'. in line 20
此外,在合并规则中,运行中的 python 代码不起作用。
snakemake 包中的教程没有涵盖足够的示例来了解非计算机科学家的详细信息。如果有人知道学习如何使用蛇的好资源,如果他们能分享:),我将不胜感激。
问题是您在规则download
的输出中有一个 expand
函数,该函数没有定义通配符{chromo}
的值。我想你真正想要的是
rule download:
output:
'chr_dir/{chromo}',
params:
link=chromo2link,
shell:
"wget {params.link} -o {output}"
没有expand
.expand
函数只需要聚合通配符,就像您在规则merger
中所做的那样。
另请查看官方的Snakemake教程,其中对此进行了详细解释。