我是主题建模的新手,我正在尝试使用Mallet库,但我有一个问题。
我使用LDA的简单并行线程实现来查找某些实例的主题。我的问题是ParallelTopicModel中的估计函数是什么?
我在API中搜索过,但他们没有描述。我也读过这个教程。
有人能解释一下这个功能是什么吗?
编辑
这是我的代码示例:
public void runModel(Sting [] str){
ParallelTopicModel model = new ParallelTopicModel(numTopics);
ArrayList<Pipe> pipeList = new ArrayList<Pipe>();
// Pipes: lowercase, tokenize, remove stopwords, map to features
pipeList.add(new CharSequenceLowercase());
pipeList.add(new CharSequence2TokenSequence(Pattern.compile("\p{L}[\p{L}\p{P}]+\p{L}")));
pipeList.add(new TokenSequence2FeatureSequence());
InstanceList instances = new InstanceList(new SerialPipes(pipeList));
instances.addThruPipe(new StringArrayIterator(str));
model.addInstances(instances);
model.setNumThreads(THREADS);
model.setOptimizeInterval(optimizeation);
model.setBurninPeriod(burninInterval);
model.setNumIterations(numIterations);
// model.estimate();
}
estimate()
运行LDA,试图在给定数据和设置的情况下估计主题模型。
看看ParrallelTopicModel
源的main()
函数,了解估计模型所需的内容。