有一个decisiontreecclassifier用于各种类型的树(ID3,CART,C4.5),但我不明白我应该传递哪些参数来模拟传统的ID3算法行为?
说明
scikit-learn使用CART算法的优化版本。
所以你可能无法模仿课本上的ID3
http://scikit-learn.org/stable/modules/tree.html tree-algorithms-id3-c4-5-c5-0-and-cart
我不确定这是sklearn实现和ID3算法之间的唯一区别,但据我所知,您必须将ID3的标准从"基尼"更改为"熵"
DecisionTreeClassifier(criterion="entropy")
使用Id3Estimator:
from id3 import Id3Estimator
estimator = Id3Estimator()
,然后适合你的数据
estimator.fit(X, y)