我有一个看起来像这样的csv文件:
Question Answer
a A
b NaN
c NaN
d B
e NaN
f NaN
我想要的是创建一个字典(或 json 文件(,例如:
[{'answer': 'A', 'questions':'a', 'b', 'c'}, {'answer': 'B', 'questions':'d', 'e', 'f'}]
哪种方法最有效?
我们可以在groupby
之前检查ffill
df.groupby(df.Answer.ffill()).Question.agg(list).reset_index().to_dict('r')
Out[17]:
[{'Answer': 'A', 'Question': ['a', 'b', 'c']},
{'Answer': 'B', 'Question': ['d', 'e', 'f']}]