Python IndexError:只有整数



我是新手的Sklearn,并且很难格式化数据以预测和评估混淆矩阵。我正在使用这个随机的森林教程。

这是我的代码

from sklearn.ensemble import RandomForestClassifier
import numpy as np
import pandas as pd
dataframe = pd.read_csv('output.txt', sep='t')
df = pd.DataFrame(dataframe)
df['is_train'] = np.random.uniform(0, 1, len(df)) <= .75
train, test = df[df['is_train']==True], df[df['is_train']==False]
features = df.columns[1:5]
clf = RandomForestClassifier(n_jobs=2)
y, _ = pd.factorize(train['event_count'])
clf.fit(train[features], y)

我预测的这一行给出了错误:

preds = df['event_count'][clf.predict(test[features])]
IndexError: only integers, slices (`:`), ellipsis (`...`), numpy.newaxis (`None`) and integer or boolean arrays are valid indices

问题似乎是此df[:6]。那就是将您返回到每行直到6,而不是列。

相关内容

  • 没有找到相关文章

最新更新