我将如何下载min_max_scaler属性,以便我可以将相同的转换应用于其他笔记本中的数据?
为了进行全面披露,我已经在一个笔记本中训练了一个NN,并且正在不同的位置运行。我很容易在第二个位置加载训练有素的NN权重,但是在将数据输入模型之前,我需要扩展数据。为了准确,我相信它必须使用原始比例属性。
根据文档,您可以使用
来重新创建最低最低scaleer的功能X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))
X_scaled = X_std * (max - min) + min
其中x是您的原始数据集。(尽管只要您的功能范围是(0,1)的默认范围,则不需要上述第二行 - 您将使用X_scaled = X_std
出来)
如果您想使用已经训练的MaxMinsCaler而不是原始数据集进行相同的计算,请考虑以下示例(再次假设功能范围留在默认值(0,1))
)from sklearn.preprocessing import MinMaxScaler
import pandas as pd
import numpy as np
# Test data set
X = pd.DataFrame(np.random.randint(0, 100, size=(20,4)))
# Test scaler
scaler = MinMaxScaler()
sklearn_result = scaler.fit_transform(X)
# Compute, and verify results match up to machine precision
manual_result = (X - scaler.data_min_)/(scaler.data_max_ - scaler.data_min_)
(sklearn_result - test).max().max() . # Is around 10e-16