自动读取文件和计数重复元素

  • 本文关键字:元素 读取 文件 python file
  • 更新时间 :
  • 英文 :


我需要帮助来快速解决问题。在工作中,我有一个每行有18个字符的文件(有600多行)。我需要阅读每行,每行阅读6个字符在一个时间。在这6个字符中,我想计算它在这个文件中重复了多少次。例如:ABCDEF - 4, ABDEDF - 1, AAAAAA - 10…我正在研究Python可能是我的解决方案(如果有人有其他语言的灵丹妙药,欢迎)。很抱歉没有掌握编程,留下我开始的东西。但是我看到我可以使用这样的东西(Python):

from collections import Counter
with open('arq.txt') as f:
occurrence= Counter(f.read().split())
print(occurrence) 

这是你需要的吗?

给定这个文件:

$ cat file.txt 
aaaaaabbbbbbcccccc
bbbbbbcccccceeeeee

计数器代码:

import json
import textwrap
from collections import Counter
group_size = 6
res = Counter()
with open('file.txt') as f:
for line in f:
res.update({_: 1 for _ in textwrap.wrap(line, group_size)})
print(res)    
with open('results.json', 'w') as f:
json.dump(dict(res), f)
输出:

Counter({'bbbbbb': 2, 'cccccc': 2, 'aaaaaa': 1, 'eeeeee': 1})

结果文件:

$ cat results.json 
{"aaaaaa": 1, "bbbbbb": 2, "cccccc": 2, "eeeeee": 1}

最新更新