如何查看 NLTK 分类器训练方法的内部



我一直在看Laurent Luce关于情绪分析的博客。 不幸的是,我无法关注他的博客,所以我不能直接问他一个问题。 这是博客的链接:http://www.laurentluce.com/posts/twitter-sentiment-analysis-using-python-and-nltk/

几乎所有东西都很好。但是,我不知道如何让这部分工作 - 下面的文本是从链接粘贴的。我的问题是如何查看分类器训练方法的内部?如果我能做到这一点,这将有助于我的理解。

"让我们来看看NLTK库源代码中的分类器训练方法。label_probdist"是每个标签的先验概率,"feature_probdist"是特征/值概率字典。这两个概率对象用于创建分类器。

def train(labeled_featuresets, estimator=ELEProbDist):
...
# Create the P(label) distribution
label_probdist = estimator(label_freqdist)
...
# Create the P(fval|label, fname) distribution
feature_probdist = {}
...
return NaiveBayesClassifier(label_probdist, feature_probdist)

NLTK是开源的。您可以在此处找到源代码。Github具有可靠的搜索功能,因此您应该能够使用它找到所需的任何内容。具体来说,朴素贝叶斯分类器在这里 您可以在该文件中看到它的训练方法。

最新更新