说我有以下词典(我正在使用的词语要大得多):
dict1={1:["item", "word", "thing"], 2:["word", "item"], 3:["thing", "item", "item"]}
并在列表中存储的字典中使用的每个单词:
all_words=["item", "word", "thing"]
我想通过词典子框来运行列表的每个单词,并返回所有找到它们的符合人物的钥匙,并将它们存储在元组中。所以我想得到:
dict2={"item":(1, 2, 3), "word":(1, 2), "thing":(1, 3)}
我拥有的东西:
dict2={}
for word in all_words:
for key, sublist in dict2.items():
for word in sublist:
if word not in sublist:
dict2[word]=dict2[word]+key
else:
dict2[word]=key
因此,基于评论的固定程序看起来像
>>> dict2 = {}
>>> for word in all_words:
... # Iterate over the dict1's items
... for key, sublist in dict1.items():
... # If the word is found in the sublist
... if word in sublist:
... # If the current word is found in dict2's keys
... if word in dict2:
... # Append the current key as a one element tuple
... dict2[word] += (key,)
... else:
... # Create a one element tuple and assign it to the word
... dict2[word] = (key,)
...
>>> dict2
{'item': (1, 2, 3), 'word': (1, 2), 'thing': (1, 3)}
如果您知道字典理解,则可以写为
>>> {word: tuple(k for k, v in dict1.items() if word in v) for word in all_words}
{'item': (1, 2, 3), 'word': (1, 2), 'thing': (1, 3)}
基于每个相应word
的dict1
的整个元组创建逻辑已被挤压为单个发电机表达式,并使用tuple(k for k, v in dict1.items() if word in v)
您的代码的逻辑不正确,因为您只需要迭代3个对象,而您只需要迭代字典并扭转键和值的位置,但是由于您可能具有重复的值,您可以可以使用set
容器保留每个名称的相应键。dict.setdefault
是这种情况的绝佳工具:
>>> d={}
>>> for i,j in dict1.items():
... for k in j:
... d.setdefault(k,set()).add(i)
...
>>> d
{'item': set([1, 2, 3]), 'word': set([1, 2]), 'thing': set([1, 3])}
问题是您正在循环dict2.items
,而应该是dict1.items
。另外,您不是附加 如果发现了dict2
值,则只需将值重新分配到dict1
值中的最后一个键即可。因此,dict2
值不是您所期望的。
相反,您可以使用collections.defaultdict
(或使用@kasra,@thefourtheye的解决方案):
from collections import defaultdict
dict2 = defaultdict(tuple)
for word in all_words:
for key, sublist in dict1.iteritems(): # this
if word in sublist:
dict2[word] += (k,)
else:
dict2[word] = (k,)
dict2
Out[3]: defaultdict(<type 'tuple'>, {'item': (1, 2, 3), 'word': (1, 2), 'thing': (1, 3)})