我使用scikit-learn LDA
生成LDA模型,然后我可以得到主题术语。我想知道如何获得每个文档的每个主题的概率?
拟
合模型后使用LatentDirichletAllocation
类的transform
方法。它将返回文档主题分发。
如果您使用 scikit-learn 的潜在狄利克雷分配文档中给出的示例,则可以通过将以下行附加到代码来访问文档主题分发:
doc_topic_dist = lda.transform(tf)
在这里,lda
是经过训练的LDA模型,tf
是文档单词矩阵。