我有一个有20个键的字典,每个键都有从不同语言翻译成法语的句子列表形式的值。关键是告诉我语言的名称。这就是为什么我想让所有的字典键在我的数据框的第一列。
我想要的是将我的字典转换为一个数据帧,其中字典键作为索引或第一列。
我的代码for k, v in Liste_phrases_retraduit.items():
v = [i.split("t") for i in v]
df = pd.DataFrame(v, columns = ['identifiant', 'verbatim', 'etiquette'] )
print(df.head())
当前输出:
identifiant verbatim etiquette
0 identifiant verbatim etiquette
1 463 Quels problèmes ce concept résout-il ? Nous re... M
2 2647 Cela signifie donc que pour la solution, vous ... C
3 5391 Cela ne changera pas la qualité du produit, je... M
4 1120 C'est très intéressant, parce que c'est un env... M
identifiant verbatim etiquette
0 identifiant verbatim etiquette
1 463 Quels problèmes ce concept résout-il ? Nous re... M
2 2647 Cela signifie donc que pour le résoudre, nous ... C
3 5391 Je ne pense pas que cela changera la qualité d... M
4 1120 Sur les stations de pompage, c'est très intére... M
identifiant verbatim etiquette
0 identifiant verbatim etiquette
1 463 Quels problèmes ce concept résout-il ? Nous re... M
2 2647 Cela signifie donc que pour la solution, vous ... C
3 5391 Cela ne changera pas la qualité du produit, je... M
4 1120 sur les stations de pompage, c'est très intére... M
正如您所看到的,它是一样的,但是没有键。我不知道哪个句子属于哪个语言。这将有助于我在以后的阶段过滤数据。
预期输出:
id_langue identifiant verbatim etiquette
0 british identifiant verbatim etiquette
1 british 463 Quels problèmes ce concept résout-il ? Nous re... M
2 .... 2647 Cela signifie donc que pour la solution, vous ... C
0 american identifiant verbatim etiquette
1 american 463 Quels problèmes ce concept résout-il ? Nous re... M
2 .... 2647 Cela signifie donc que pour la solution, vous ... C
我找到了解决方案。只需在数据框架中添加另一列,并将键作为值。
df['id_langue'] = k