我有一个带有3列的数据框架,所有这些都有字符串值。数据框架是此形式的:
Key Word Synonym Alternatives
A word1 NaN
A word2 NaN
A word3 word11
B word4 word12
B word5 NaN
B word6 word13
C word7 word14
C word8 NaN
C word9 NaN
D word10 word15
我想要的是将其转换为词典,该字典将根据 Key Word
列和每个键_word进行分组,以返回所有相应的同义词和替代同义词。因此,A
的所有值都将参考Synonym
和Alternatives
中CC_4中存在的相应值等。是否有办法做到这一点?预先感谢您。
我认为您需要 stack
drop NaN
s,然后用 list
进行 groupby
。上次通话to_dict
:
d = df.set_index('Key').stack().groupby('Key').apply(list).to_dict()
print (d)
{'B': ['word4', 'word12', 'word5', 'word6', 'word13'],
'D': ['word10', 'word15'],
'C': ['word7', 'word14', 'word8', 'word9'],
'A': ['word1', 'word2', 'word3', 'word11']}