Pandas Dataframe to dictionary groupby index



我有一个带有3列的数据框架,所有这些都有字符串值。数据框架是此形式的:

Key Word    Synonym    Alternatives
   A          word1         NaN
   A          word2         NaN
   A          word3         word11
   B          word4         word12
   B          word5         NaN 
   B          word6         word13
   C          word7         word14
   C          word8         NaN
   C          word9         NaN
   D          word10        word15

我想要的是将其转换为词典,该字典将根据 Key Word列和每个键_word进行分组,以返回所有相应的同义词和替代同义词。因此,A的所有值都将参考SynonymAlternatives中CC_4中存在的相应值等。是否有办法做到这一点?预先感谢您。

我认为您需要 stack drop NaN s,然后用 list进行 groupby。上次通话to_dict

d = df.set_index('Key').stack().groupby('Key').apply(list).to_dict()
print (d)
{'B': ['word4', 'word12', 'word5', 'word6', 'word13'], 
 'D': ['word10', 'word15'], 
 'C': ['word7', 'word14', 'word8', 'word9'], 
 'A': ['word1', 'word2', 'word3', 'word11']}

最新更新