如何在 gensim 中使用木槌设置主题模型的随机种子?



我一直试图通过在 gensim 中使用 mallet 作为库来保持主题建模的输出稳定。但是,我发现 mallet 可以设置随机种子,但我在 gensim 中没有看到任何参数来设置它。

这刚刚被添加到 ldamallet.py 包装器

def __init__(self, mallet_path, corpus=None, num_topics=100, alpha=50, id2word=None, workers=4, prefix=None,
optimize_interval=0, iterations=1000, topic_threshold=0.0, random_seed=0):
"""
Parameters
----------
mallet_path : str
Path to the mallet binary, e.g. `/home/username/mallet-2.0.7/bin/mallet`.
corpus : iterable of iterable of (int, int), optional
Collection of texts in BoW format.
num_topics : int, optional
Number of topics.
alpha : int, optional
Alpha parameter of LDA.
id2word : :class:`~gensim.corpora.dictionary.Dictionary`, optional
Mapping between tokens ids and words from corpus, if not specified - will be inferred from `corpus`.
workers : int, optional
Number of threads that will be used for training.
prefix : str, optional
Prefix for produced temporary files.
optimize_interval : int, optional
Optimize hyperparameters every `optimize_interval` iterations
(sometimes leads to Java exception 0 to switch off hyperparameter optimization).
iterations : int, optional
Number of training iterations.
topic_threshold : float, optional
Threshold of the probability above which we consider a topic.
random_seed: int, optional
Random seed to ensure consistent results, if 0 - use system clock.
"""

我遇到了同样的问题,但是要使用最新版本的gensim,这有点棘手。正如克里斯所说,新版本已经实现了,但运行它对我来说很麻烦。确保执行以下操作,因为您可能正在使用旧包装器:

  1. conda install -c conda-forge gensim
  2. pip install --upgrade gensim

第二步完成了这项工作,仅安装它不会更新gensim因为我遇到了问题。

以下链接包含有关您的问题的更多信息:

玄西姆安装

木槌包装机

相关内容

  • 没有找到相关文章

最新更新