K-means clustering: ValueError:无法将字符串转换为浮点数



我正在尝试使用k-means算法进行一些聚类,但我得到了这个错误:ValueError: could not convert string to float: 'M'.

我认为发生这种情况是因为我的变量是分类变量,而聚类只允许连续变量。我该怎么做才能使这个变量连续呢?使用字典转换它不是一个好主意,因为说M>F(例如)没有意义。

K-means聚类将需要数字来计算由变量定义的空间中的聚类中心。你可以决定定义M为0 F为1,或者相反。这里M大于F或相反情况并不重要,只要它给算法机会分离空间中不同的数据点,以便对它们进行聚类。

然而,如果正在寻找的集群不应该是不同性别的子组,那么尝试使用此功能将会出现一些问题,我建议在这种情况下只使用连续变量。

最新更新