什么是使用mallet库进行主题建模的估计函数



我是主题建模的新手,我正在尝试使用Mallet库,但我有一个问题。

我使用LDA的简单并行线程实现来查找某些实例的主题。我的问题是ParallelTopicModel中的估计函数是什么?

我在API中搜索过,但他们没有描述。我也读过这个教程。

有人能解释一下这个功能是什么吗?

编辑

这是我的代码示例:

 public void runModel(Sting [] str){    
    ParallelTopicModel model = new ParallelTopicModel(numTopics);
    ArrayList<Pipe> pipeList = new ArrayList<Pipe>();
    // Pipes: lowercase, tokenize, remove stopwords, map to features
    pipeList.add(new CharSequenceLowercase());
    pipeList.add(new CharSequence2TokenSequence(Pattern.compile("\p{L}[\p{L}\p{P}]+\p{L}")));
    pipeList.add(new TokenSequence2FeatureSequence());
    InstanceList instances = new InstanceList(new SerialPipes(pipeList));
    instances.addThruPipe(new StringArrayIterator(str));
     model.addInstances(instances);
     model.setNumThreads(THREADS);
     model.setOptimizeInterval(optimizeation);
     model.setBurninPeriod(burninInterval);
     model.setNumIterations(numIterations);
     // model.estimate();
 }

estimate()运行LDA,试图在给定数据和设置的情况下估计主题模型。

看看ParrallelTopicModel源的main()函数,了解估计模型所需的内容。

相关内容

  • 没有找到相关文章

最新更新