在执行test-train-dev分割之后,如何对pandas中的行进行洗牌,保留索引以供将来验证?



我有一个数据帧,我需要洗牌,同时知道句子1去了哪里,例如,之前:

targe_sentence_100 targe_sentence_101targe_sentence_102

如果我理解正确,也许你的训练/测试(等)分成,说,df_train, df_test。然后通过df_train.indexdf_test.index保存它们的索引,并将它们存储在某个地方。Like to CSV.

类似:

df_train.reset_index()['index'].to_csv('df_train_index_save.csv', index=None)

df_train.reset_index()将索引复制到名为'index'的列。

然后df_train.reset_index()['index']只选择该列用于随后保存到CSV。

最新更新