如何使用Python计算字符串数组在文本中出现的次数



我有一些文本,raw_text和一个单词数组:

VERBS = ['be', 'am', 'is', 'are', 'was', 'were', 'being', 'been']

我想数一下这些单词中ANY在raw_text中的使用次数。大小写无关紧要,但单词的界限会很重要。

我相信这是可行的Regex或NLTK。有什么想法吗?

VERBS = ['be', 'am', 'is', 'are', 'was', 'were', 'being', 'been']
raw_text = "This IS example text which we will use to count these words: am, be, is, are"

raw_text2 = " " + raw_text.lower() + " "
cnt = 0   
for verb in VERBS:
cnt += (len(raw_text2.split(f" {verb} "))-1)
cnt += (len(raw_text2.split(f" {verb},"))-1)
print(cnt)

最新更新