如何将字典列表转换为Huggingface数据集对象



我有一个字典列表:

print(type(train_dataset))
>>> <class 'list'>
print(len(train_dataset))
>>> 4000
train_dataset[0]
>>>
{'id': '7',
'question': {'stem': 'Who is A',
'choices': [{'text': 'A is X', 'label': 'A'},
{'text': 'A is not B', 'label': 'D'}]},
'answerKey': 'D'}

如何将其转换为huggingface数据集对象?从他们的网站上看,你似乎只能转换pandas-df(dataset = Dataset.from_pandas(df)(或字典(dataset = Dataset.from_dict(my_dict)(,但不清楚如何使用字典列表

从这里开始:https://discuss.huggingface.co/t/convert-a-list-of-dictionaries-to-hugging-face-dataset-object/14670

datasets.Dataset.from_pandas(pd.DataFrame(data=your_data))

最新更新