我在一个文档语料库上使用了LDA,并找到了一些主题。我的代码的输出是两个包含概率的矩阵。一个是doc-topic概率,另一个是word-topic概率。但我实际上不知道如何使用这些结果来预测新文档的主题。我用的是吉布斯抽样。有人知道怎么做吗?由于
Java实现http://www.arbylon.net/projects/lda-j/lda-j-src-20050325.zip在srcorgknowceansldaSearchEnglet.java中有一个简短的示例程序。我希望你对java有点熟悉,这些代码对你有帮助。
原始论文http://jmlr.csail.mit.edu/papers/volume3/blei03a/blei03a.pdf在5.1和5.2节中描述了推理。