在python中如何考虑与一个单词内容相同的单词?



我有一个类似于下面的列表,我想考虑与一个单词具有相同内容的单词。有没有更有效的方法?

list 1 = ['data mining', 'datamining', 'data science', 'graph model']
list 2 = ['data mining', 'data mining', 'data mining', 'graph model']

list 2 = [item.replace('datamining', 'data mining') for item in  list 1]
list 2 = [item.replace('data science', 'data mining') for item in  list 1]

创建单词到其规范替换的映射,例如

d = {
'datamining': 'data mining',
'data science': 'data mining',
}

然后将list1中的每个单词替换为其正则替换;未映射的单词被替换为自身。

list2 = [d.get(k, k) for k in list1]

最新更新