我有一个经过训练的神经网络,效果非常好,但我事先缩放了数据[sklearn preprocessing.scale(X)]。这很好用,但是当我保存模型并想要在其中输入新数据时,我该怎么办?如何确保缩放与训练时相同?
df = pd.read_csv("Trimmed Training Data.csv", delimiter=",")
X = np.array(df.drop(['PredictThis'],1))
y = np.array(df['PredictThis'])
X = preprocessing.scale(X)
# create NN model
model = Sequential()
# 2 inputs, 10 neurons in 1 hidden layer, with tanh activation and dropout
model.add(Dropout(0.2, input_shape=(15,)))
model.add(Dense(100, init='uniform', input_shape=(15,), activation='relu'))
model.add(Dropout(0.2))
model.add(Dense(100, init='uniform', input_shape=(100,), activation='relu'))
model.add(Dropout(0.2))
model.add(Dense(5, init='uniform', input_shape=(100,), activation='relu'))
model.add(Dropout(0.2))
model.add(Dense(1, init='uniform', activation='sigmoid'))
model.compile(loss='binary_crossentropy', optimizer='rmsprop')
# Fit the model
model.fit(X, y, nb_epoch=25, batch_size=15)
通常做的是保存一个scale
对象,你可以在这里读到。
以下是保存对象scale
方法:
from sklearn.externals import joblib
joblib.dump(scale, 'filename.pkl')
以下是重新加载它的方法:
scale = joblib.load('filename.pkl')
预测新数据时 - 最好重新加载缩放器 - 相应地缩放数据,然后使用模型。您甚至可以创建一个新类,其中缩放器像keras.model
一样保留和保存。