我是文本分析的新手,遇到了一个文档中似乎没有回答的问题(或者至少找不到(。
我从Quantada DfM创建了一个R中的STM,它有相关的docvars。主题基于新闻来源,docvars表示新闻渠道和日期(作为一个字符串(。
STM的估计进展顺利,但对于我的项目,我真正想知道的是哪个新闻媒体和日期组合与哪些主题相关。本质上,我想要一个类似的输出
outlet_date topic_1 topic_2 topic_3
newyorktimes_20181001 0.6 0.23 0.17
newyorktimes_20181002 0.54 0.4 0.06
newyorktimes_20181003 0.2 0.73 0.07
这可能吗?
很抱歉没有一个可复制的例子——不知道如何包含一个,给出了达到这一点的所有步骤。非常感谢!
以下是解决方案!
图书馆x<-整洁(topicModelName,matrix="gamma",document_names=行名(df((