如何显示模型的输出



我正在执行一项机器学习任务,其中我使用逻辑回归进行主题分类。

如果这是我的代码:

model= LogisticRegression()
model= model.fit(mat_tmp, label_tmp)
y_train_pred = model.predict(mat_tmp_test)
print(metrics.accuracy_score(label_tmp_test, y_train_pred))

有没有办法输出模型内部到底发生了什么。就像我的模型正在做什么的工作示例一样?比如显示 2-3 个文档以及它们是如何分类的?

为了充分了解模型中正在发生的事情,您必须首先花一些时间来研究逻辑回归算法(例如,从讲义或维基百科)。与其他监督技术一样,逻辑回归具有超参数和参数。超参数基本上指定了算法的运行方式,您必须在初始化时(即在它看到任何数据之前)提供。例如,您可以事先获得有关类分布的信息,这些信息将成为超参数。 参数是从您的数据中"学习"的。

一旦你理解了算法,有趣的问题将是你的模型的参数是什么(回想一下,这些是从数据中检索的)。通过访问文档,您可以在属性部分找到此分类器有 3 个参数,您可以通过其字段名称访问这些参数。

如果您对这些细节不感兴趣,而只想评估分类器的准确性,那么交叉验证是一种有用的技术。您将标记的数据拆分为 k 个大小相等的子集,并使用其中的 k-1 训练分类器。然后,在剩余的 1 个子集上评估经过训练的分类器并计算准确性(即可以正确预测的数据比例)。这种方法有其缺点,但被证明非常有用。

相关内容

  • 没有找到相关文章