下面是我必须检索前 20 个最常出现的元素的代码
countStemWords = Counter(ListofStemWords)
countStemWords.most_common(20)
我知道计数器是 Dict 的一个子类,其中键是出现的单词,值是单词出现的次数。我正在尝试做的是只检索没有前 20 个最常出现的单词值的键,并将它们存储到列表中。例如
('code', 4193), ('gt', 1522), ('python', 1293)...
自
(code), (gt), (python)...
并将结果(不带括号和逗号)存储到列表中,以便
list[0] = code, list[1] = gt list[2] = python
使用列表推导:
top_twenty = [item[0] for item in countStemWords.most_common(20)]
这将为您提供您指定的列表。