我的问题与此完全相似, 如何在朴素贝叶斯中获得特征重要性?
但是当我运行代码时
neg_class_prob_sorted = NB_optimal.feature_log_prob_[0, :].argsort()
pos_class_prob_sorted = NB_optimal.feature_log_prob_[1, :].argsort()
print(np.take(count_vect.get_feature_names(), neg_class_prob_sorted[:10]))
print(np.take(count_vect.get_feature_names(), pos_class_prob_sorted[:10]))
它总是打印具有相同首字母的单词
['aafco' 'misfit' 'misfir' 'miseri' 'miser' 'misconcept' 'miscarriag'
'misc' 'mirin' 'minuscul']
['aafco' 'metrx' 'meticul' 'methood' 'metaplus' 'metaphor' 'mestemach'
'messiest' 'mesmer' 'mesa']
有没有更好的方法可以打印腐蚀到正负类的重要特征?
important_features= pd。DataFrame(data=np.transpose(model.fit(fdata, y_train(.feature_log_prob_(.astype("float32"(,index=fdata.columns(