如何将scikit-learn的LogisticRegression应用于某些十进制数据?



我有这样的训练数据集:

0.00479616 |  0.0119904 |  0.00483092 |  0.0120773 | 1
0.51213136 |  0.0113404 |  0.02383092 |  -0.012073 | 0
0.10479096 |  -0.011704 |  -0.0453692 |  0.0350773 | 0

前4列是一个示例的特征,最后一列是其输出。

我是这样使用scikit的:

  data = np.array(data)
  lr = linear_model.LogisticRegression(C=10)
  X = data[:,:-1]
  Y = data[:,-1]
  lr.fit(X, Y)
  print lr
  # The output is always 1 or 0, not a probability number.
  print lr.predict(data[0][:-1])

我认为逻辑回归应该给出一个介于0和1之间的概率数。

使用predict_proba方法获取概率。predict给出了类标签。

>>> lr = LogisticRegression()
>>> X = np.random.randn(3, 4)
>>> y = [1, 0, 0]
>>> lr.fit(X, y)
LogisticRegression(C=1.0, class_weight=None, dual=False, fit_intercept=True,
          intercept_scaling=1, penalty='l2', random_state=None, tol=0.0001)
>>> lr.predict_proba(X[0])
array([[ 0.49197272,  0.50802728]])

(如果你读过文档,你就会发现这一点。)

相关内容

  • 没有找到相关文章

最新更新