从 计算序列的长度.公共广播公司文件



我是新来的。我正在寻求有关生物信息学类型任务的帮助。任务是计算.pbs文件中所有序列的总长度。

打开文件时,将显示如下内容:

长度为102

长度为1100

长度为101

长度为 111200

长度为102

我看到长度像一个列表,带有字母和数字。我需要帮助弄清楚要编写什么 python 代码来将所有长度相加。并非所有的总和都相同。

到目前为止,我的代码是:

f = open('lengthofsequence2.pbs.o8767272','r')
lines = f.readlines()
f.close()
def lengthofsequencesinpbsfile(i):
    for x in i:
        if
            return x +=
print lengthofsequencesinpbsfile(lines)

我不确定如何处理 for 循环。我只想数"长度是......"语句后面的数字

谢谢!

"The Length is "有 14 个字符,所以line[14:]会给你与你所追求的数字相对应的子字符串(从第 14 个字符之后开始),然后你只需要在添加到总数之前用 int(line[14:]) 将其转换为inttotal += int(line[14:])

  1. 您需要解析输入以获取要使用的数据。
    一个。 x.replace('长度是',') - 这将删除不需要的文本。
    b. int(x.replace('The Length is ',')) - 将数字字符转换为
    整数
  2. 添加到总计:总计 += int(x.replace('长度是','))

所有这些都可以通过谷歌直接访问。 我寻找了python字符串函数和类型转换函数。 我只简要地看过python,从来没有用它编程过,但我认为这两个项目应该可以帮助你做你想做的事情。

最新更新