如何使用一个字典的键作为一个熊猫数据框架列?



我有一个有20个键的字典,每个键都有从不同语言翻译成法语的句子列表形式的值。关键是告诉我语言的名称。这就是为什么我想让所有的字典键在我的数据框的第一列。

我想要的是将我的字典转换为一个数据帧,其中字典键作为索引或第一列。

我的代码
for k, v in Liste_phrases_retraduit.items():
v = [i.split("t") for i in v]
df = pd.DataFrame(v, columns = ['identifiant', 'verbatim', 'etiquette'] )
print(df.head())

当前输出:

identifiant                                           verbatim  etiquette
0  identifiant                                           verbatim  etiquette
1          463  Quels problèmes ce concept résout-il ? Nous re...          M
2         2647  Cela signifie donc que pour la solution, vous ...          C
3         5391  Cela ne changera pas la qualité du produit, je...          M
4         1120  C'est très intéressant, parce que c'est un env...          M
identifiant                                           verbatim  etiquette
0  identifiant                                           verbatim  etiquette
1          463  Quels problèmes ce concept résout-il ? Nous re...          M
2         2647  Cela signifie donc que pour le résoudre, nous ...          C
3         5391  Je ne pense pas que cela changera la qualité d...          M
4         1120  Sur les stations de pompage, c'est très intére...          M
identifiant                                           verbatim  etiquette
0  identifiant                                           verbatim  etiquette
1          463  Quels problèmes ce concept résout-il ? Nous re...          M
2         2647  Cela signifie donc que pour la solution, vous ...          C
3         5391  Cela ne changera pas la qualité du produit, je...          M
4         1120  sur les stations de pompage, c'est très intére...          M                                    

正如您所看到的,它是一样的,但是没有键。我不知道哪个句子属于哪个语言。这将有助于我在以后的阶段过滤数据。

预期输出:

id_langue  identifiant                                           verbatim  etiquette
0  british   identifiant                                           verbatim  etiquette
1  british        463  Quels problèmes ce concept résout-il ? Nous re...          M
2   ....          2647  Cela signifie donc que pour la solution, vous ...          C

0  american   identifiant                                           verbatim  etiquette
1  american       463  Quels problèmes ce concept résout-il ? Nous re...          M
2   ....          2647  Cela signifie donc que pour la solution, vous ...          C

我找到了解决方案。只需在数据框架中添加另一列,并将键作为值。

df['id_langue'] = k 

相关内容

  • 没有找到相关文章

最新更新