我想从我在scikit-learn中使用的数据来估计模型。我正在使用 DecisionTreeClassifier.score
函数,但在运行代码时,我会收到一个 ValueError:
无法处理连续类和多类的混合。
这是我使用的代码:
from sklearn import datasets
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
nba = pd.read_excel(r"C:UsersuserDesktopnba.xlsx")
X = nba.drop('平均得分', axis = 1)
y = nba['平均得分']
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size = 0.20)
nba_tree = DecisionTreeClassifier()
nba_tree.fit(X_train, y_train.astype('int'))
y_pred = nba_tree.predict(X_test)
nba_tree.score(X_test, y_test)
看起来你的目标变量平均得分
是一个连续变量。可能您正在尝试解决回归问题。如果是这种情况,请尝试 DecisionTreeRegressor 而不是 DecisionTreeClassifier。