在朴素贝叶斯中获得特征重要性



我的问题与此完全相似, 如何在朴素贝叶斯中获得特征重要性?

但是当我运行代码时

neg_class_prob_sorted = NB_optimal.feature_log_prob_[0, :].argsort()
pos_class_prob_sorted = NB_optimal.feature_log_prob_[1, :].argsort()
print(np.take(count_vect.get_feature_names(), neg_class_prob_sorted[:10]))
print(np.take(count_vect.get_feature_names(), pos_class_prob_sorted[:10]))

它总是打印具有相同首字母的单词

['aafco' 'misfit' 'misfir' 'miseri' 'miser' 'misconcept' 'miscarriag'
'misc' 'mirin' 'minuscul']
['aafco' 'metrx' 'meticul' 'methood' 'metaplus' 'metaphor' 'mestemach'
'messiest' 'mesmer' 'mesa']

有没有更好的方法可以打印腐蚀到正负类的重要特征?

important_features= pd。DataFrame(data=np.transpose(model.fit(fdata, y_train(.feature_log_prob_(.astype("float32"(,index=fdata.columns(

最新更新