这是我想要下载和保存的文件类型:
http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=nuccore&id=562868704,585641505&rettype=fasta&retmode=text
。这是测试代码:
import urllib.request
import xml.etree.ElementTree as ET
mystring = ' '
link = urllib.request.urlopen('http://eutils.ncbi.nlm.nih.gov/entrez/eutils/elink.fcgi?dbfrom=protein&db=nuccore&linkname=protein_nuccore_mrna&id=13591999,149050462')
tree = ET.parse(link)
root = tree.getroot()
for branch in root.iter('Link'):
for something in branch.iter('Id'):
mystring += something.text + ','
mRNA = urllib.request.urlretrieve('http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=nuccore&id=' + mystring + '&rettype=fasta&retmode=text', 'C:/Users/User/Documents/mRNA.fasta')
它创建了文件,但随后为空,我不知道问题是什么。谢谢你的帮助。
生成的 URL 包含一个空格;你自己把它放在那里:
mystring = ' '
如果我用空字符串替换它,您的代码似乎可以正常工作:
mystring = ''
您可以使用列表并使用 str.join()
方法来构建值,而不是使用字符串串联:
elements = []
for element in root.findall('.//Link/Id'):
elements.append(element.text)
mystring = ','.join(elements)
我将 Element.findall()
方法与 XPath 表达式一起使用,以列出所有匹配的 Id 节点。