如何使用 LDA 获取每个文档的主题概率以进行主题建模



我使用scikit-learn LDA生成LDA模型,然后我可以得到主题术语。我想知道如何获得每个文档的每个主题的概率?

合模型后使用LatentDirichletAllocation类的transform方法。它将返回文档主题分发。

如果您使用 scikit-learn 的潜在狄利克雷分配文档中给出的示例,则可以通过将以下行附加到代码来访问文档主题分发:

doc_topic_dist = lda.transform(tf)

在这里,lda是经过训练的LDA模型,tf是文档单词矩阵。

最新更新