gensim-lda模型中的主题权重



我们在gensim包中有计算主题权重的函数吗?我需要这个权重来将它们与0.05(p_value(进行比较,以了解哪一个是平均满的。

不清楚你说的"主题权重";。你能在评论中澄清或编辑你的问题吗?

get_document_topics()(docs(这样的核心Gensim LDA方法已经以(topic, probability)对的列表形式返回结果,并允许您提供可选的minimum_probability以不返回任何概率较低的主题。这大概就是你想要的。

但请记住,尽管许多研究领域的惯例是";零假设产生这些结果的机会小于0.05〃;,这个门槛并没有什么神奇或真实的地方&只是很方便;习惯的LDA报告的概率较低的主题对最终用户或下游分析(如分类器(仍然有用。

最新更新