在scikit中保存决策树模型



我正在使用Python中的Scikit Learn构建一个决策树。我已经在一个特定的数据集上训练了模型,现在我想保存这个决策树,以便以后(在新数据集上)使用。有人知道怎么做吗?

摘自本教程的模型持久性部分:

可以使用Python内置的持久性模型在scikit中保存一个模型,即pickle:

>>> from sklearn import svm
>>> from sklearn import datasets
>>> clf = svm.SVC()
>>> iris = datasets.load_iris()
>>> X, y = iris.data, iris.target
>>> clf.fit(X, y)  
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0, degree=3, gamma=0.0,
  kernel='rbf', max_iter=-1, probability=False, random_state=None,
  shrinking=True, tol=0.001, verbose=False)
>>> import pickle
>>> s = pickle.dumps(clf)
>>> clf2 = pickle.loads(s)
>>> clf2.predict(X[0])
array([0])
>>> y[0]
0

目前没有可靠的方法来做到这一点。虽然酸洗确实有效,但它还不够好,因为您的酸洗数据不能保证在后续版本的scikit learn中正确解锁。

报价来源:http://scikit-learn.org/stable/modules/model_persistence.html#security-可维护性限制

保存在scikit learn的一个版本中的模型可能无法加载到另一个版本版本

我使用joblib如下:

>>> from joblib import dump, load
>>> dump(clf, 'filename.joblib')
>>> clf = load('filename.joblib')

然而,需要考虑这些安全性和可维护性的限制。

相关内容

  • 没有找到相关文章

最新更新