rapidminer和scikit-learn中的DBSCAN算法



我试图找到一个聚类算法聚类标称数据与python。为此,我尝试了使用RapidMiner的DBSCAN算法,它可以处理标称数据。但是,当我使用scikit-learn提供的DBSCAN算法尝试相同的数据集时,它给出的错误表明函数无法将字符串转换为浮点数。

dbscan在rapidminer和scikit-learn不同,我如何解决这个问题?另外,如果你告诉我另一种适用于名义数据的聚类算法会很棒吗?

SciPy默认为欧几里得距离(metric='euclidean'),该距离对于标称数据没有定义。

您需要指定您的距离测量!

RapidMiner实现了各种距离度量,包括标称距离。这被DBSCAN和其他算法所使用。

如果属性值相同,则两个示例之间的距离为零,否则为1。换句话说,"树莓"与"苹果"one_answers"电脑"的距离是1。此外,"Apple"与"Raspberry"one_answers"Computer"等是一个区别。

相关内容

  • 没有找到相关文章

最新更新