我有一个数据集,其中包含运行不同天数的策略。与运行天数较短的策略相比,运行天数较长的策略必须具有更高的权重。有没有办法在python的基于树的模型中做到这一点?特别是决策树模型。
每个策略为1行。
谢谢,
您可以使用fit()
函数的sample_weight
参数来对训练样本进行加权。
:
from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import make_classification
X, y = make_classification()
weights = np.random.uniform(size=y.shape)
DecisionTreeClassifier().fit(X, y, sample_weight=weights)