使用scikit学习的无监督机器学习



我正在使用scikit learn学习无监督机器学习。我从网上收集了这么多数据。当我尝试应用散点图时,我得到了以下错误

索引错误:索引器太多

这是代码:

data = arff.loadarff("./Data/Arrhythmia/Arrhythmia_withoutdupl_02_v01.arff")
df = pd.DataFrame(data[0])
df = df.drop(['outlier',"id"],axis=1)
X_com = df.att10
plt.scatter(X_com.iloc[:,0],X_com.iloc[:,1])
plt.show()

我想在这里应用scikit学习的KMeans算法。我做错了什么?提前感谢

X_com是一个pd.Series,因此当您尝试使用.iloc对其进行切片时,您只能指定一个轴。

您可能希望了解前两个特性的数据分布情况。然后你必须从初始数据集中切片,而不是从系列(如@Alexandre所说(中切片

data = arff.loadarff("./Data/Arrhythmia/Arrhythmia_withoutdupl_02_v01.arff")
df = pd.DataFrame(data[0])
df = df.drop(['outlier',"id"],axis=1)
plt.scatter(df.iloc[:,0],df.iloc[:,1])
plt.show()

最新更新