我们在gensim包中有计算主题权重的函数吗?我需要这个权重来将它们与0.05(p_value(进行比较,以了解哪一个是平均满的。
不清楚你说的"主题权重";。你能在评论中澄清或编辑你的问题吗?
像get_document_topics()
(docs(这样的核心Gensim LDA方法已经以(topic, probability)
对的列表形式返回结果,并允许您提供可选的minimum_probability
以不返回任何概率较低的主题。这大概就是你想要的。
但请记住,尽管许多研究领域的惯例是";零假设产生这些结果的机会小于0.05〃;,这个门槛并没有什么神奇或真实的地方&只是很方便;习惯的LDA报告的概率较低的主题对最终用户或下游分析(如分类器(仍然有用。