我是新来的。我正在寻求有关生物信息学类型任务的帮助。任务是计算.pbs文件中所有序列的总长度。
打开文件时,将显示如下内容:
长度为102
长度为1100
长度为101
长度为 111200
长度为102
我看到长度像一个列表,带有字母和数字。我需要帮助弄清楚要编写什么 python 代码来将所有长度相加。并非所有的总和都相同。
到目前为止,我的代码是:
f = open('lengthofsequence2.pbs.o8767272','r')
lines = f.readlines()
f.close()
def lengthofsequencesinpbsfile(i):
for x in i:
if
return x +=
print lengthofsequencesinpbsfile(lines)
我不确定如何处理 for 循环。我只想数"长度是......"语句后面的数字
谢谢!
"The Length is "
有 14 个字符,所以line[14:]
会给你与你所追求的数字相对应的子字符串(从第 14 个字符之后开始),然后你只需要在添加到总数之前用 int(line[14:])
将其转换为int
:total += int(line[14:])
- 您需要解析输入以获取要使用的数据。
一个。 x.replace('长度是',') - 这将删除不需要的文本。
b. int(x.replace('The Length is ',')) - 将数字字符转换为
整数 - 添加到总计:总计 += int(x.replace('长度是','))
所有这些都可以通过谷歌直接访问。 我寻找了python字符串函数和类型转换函数。 我只简要地看过python,从来没有用它编程过,但我认为这两个项目应该可以帮助你做你想做的事情。