如何在决策树python中对观测值进行加权



我有一个数据集,其中包含运行不同天数的策略。与运行天数较短的策略相比,运行天数较长的策略必须具有更高的权重。有没有办法在python的基于树的模型中做到这一点?特别是决策树模型。

每个策略为1行。

谢谢,

您可以使用fit()函数的sample_weight参数来对训练样本进行加权。

:

from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import make_classification
X, y = make_classification()
weights = np.random.uniform(size=y.shape)
DecisionTreeClassifier().fit(X, y, sample_weight=weights)

最新更新