如何查看 NLTK 分类器训练方法的内部

我一直在看Laurent Luce关于情绪分析的博客。不幸的是，我无法关注他的博客，所以我不能直接问他一个问题。这是博客的链接：http://www.laurentluce.com/posts/twitter-sentiment-analysis-using-python-and-nltk/

几乎所有东西都很好。但是，我不知道如何让这部分工作 - 下面的文本是从链接粘贴的。我的问题是如何查看分类器训练方法的内部？如果我能做到这一点，这将有助于我的理解。

"让我们来看看NLTK库源代码中的分类器训练方法。label_probdist"是每个标签的先验概率，"feature_probdist"是特征/值概率字典。这两个概率对象用于创建分类器。

def train(labeled_featuresets, estimator=ELEProbDist):
...
# Create the P(label) distribution
label_probdist = estimator(label_freqdist)
...
# Create the P(fval|label, fname) distribution
feature_probdist = {}
...
return NaiveBayesClassifier(label_probdist, feature_probdist)

NLTK是开源的。您可以在此处找到源代码。Github具有可靠的搜索功能，因此您应该能够使用它找到所需的任何内容。具体来说，朴素贝叶斯分类器在这里您可以在该文件中看到它的训练方法。

相关内容

最新更新

热门标签：