我正试图弄清楚如何使用LabelEncode((中的inverse_transform函数。例如,在下面的代码中,
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
df['Label'] = le.fit_transform(df[['Actual']]
如果我想倒车,我可以简单地调用:
le.inverse_transform(df['Label'])
然而,我需要将相同的变换/逆变换应用到一个新的数据集中,这可能是从上面的模型中预测的。也就是说,这是在一个新笔记本上完成的,所以,我似乎必须存储标签。有什么办法吗?我唯一的想法是导出一个有2列的数据帧,并使用pd.merge.
- 制作一个字典,其中包含您在第一个笔记本中使用的LabelEncoder的逆变换。这里
- 然后使用该字典重新映射第二个笔记本中的值。这里