小贝子编程

在Gensim上计算一个看不见的文档的主题分布

本文关键字：看不见文档分布一个 Gensim 计算 python nlp gensim lda
更新时间 : 2023-09-07
英文 : Calculating topic distribution of an unseen document on GenSim

我正在尝试使用Gensim的LDA模块执行以下任务

"训练一个具有一个大文档的LDA模型，并跟踪10个潜在主题。给定一个新的，看不见的文档，预测10个潜在主题的概率分布"。

根据教程的按照教程：http：//radimrehurek.com/gensim/tut2.html，对于语料库中的文档来说，这似乎有可能，但是我想知道是否有可能是看不见的文档。

谢谢！

从您发布的文档中，看起来您可以像这样训练模型：

>>> model = models.LdaModel(corpus, id2word=dictionary, num_topics=100)

然后从此页面上看，您可以将模型应用于这样的"看不见的文档"：

>>> doc_lda = model[doc_bow]

其中doc_bow是doc2bow工具生成的单词袋。

最新更新

我无法显示我的所有收藏视图项目 .NET MAUI 应用程序
Programmatic NavigationLink推进去，没有动画
Angular and RxJS API calls
如何在不使用矢量的情况下调整指针的动态数组的大小?
在Hugo中将类似书籍的帖子拆分为多个页面
Django：如何创建"Published"和"Last edited"字段？
Textarea Label in Form: Error: Label元素的for属性的值必须是一个非隐藏表单控件的I
如何在没有源文件的情况下使用XSL创建XML
通过指针在实例上实现类型的调用函数
在批处理脚本中替换而不是添加前缀
如果类没有初始化，c++编译器会生成一个defctor吗?
在我的代码中没有得到任何方程的答案，我的按钮进入我的字段
vsto Outlook插件在Outlook 2016和Office 365中的行为不同
npm install不会在我的React项目中安装任何node模块
用两次检查遍历两个列表
将图像转换为RGB格式的文本文件，格式为三逗号分隔
我正试图找到一种方法将TimeSpan变量转换为秒的整数量
FCM云消息传递验证令牌
C多重间接
显示数组中元素的倒计时。setInterval 不会导致延迟。最后一个元素立即显示
sveltekit:等待来自+服务器的数据.t加载函数
JQuery是:检查每次点击返回两个值
RxJS中具有共享结果的请求队列
Beautifulsoup如何添加一些东西到列，如果元素没有显示
在Jekyll blog中按2D位置(距离)搜索
Robocopy在复制过程中向文件名添加日期
c -间接递归的用例
如何将日期对象转换为格式(DD-MM-YYYY)
如何从没有使用python硒链接的网站下载文件?
用错误处理循环捕获用户输入的最佳方法

在Gensim上计算一个看不见的文档的主题分布

相关内容

最新更新

热门标签：