我正在使用Python上的决策树做一些工作,使用scikit学习。分类器本身工作得很好,但是当我创建一个图形化的表示,而不是显示变量名,X[0], X[1]…变量显示为X[n],如scikit learn示例:http://scikit-learn.org/stable/modules/tree.html。让事情变得更加困难的是,X[0]甚至不一定与第一列相关,X[1]与第二列相关,等等,似乎在为变量分配新的"与X相关"的名称时,有一些过程正在进行。
如何将变量名放在图形表示上,将原始变量名映射到新的对应变量名,或者确保新的变量名是有序的?
tree.export_graphviz()
方法有一个名为feature_names
的参数来指定特征名称,文档说:
feature_names : list of strings, optional (default=None)
Names of each of the features.
特征名称的顺序是你训练模型的特征向量中特征的顺序。