在GreenPlum上使用Madlib库执行Kmean时错误



我正在尝试使用madlib库运行kmean算法尝试执行:

SELECT * FROM madlib.kmeans_random('select "MPrice" as "MPrice" from "madlib"."sample_sordetail"','MPrice',2,'madlib.squared_dist_norm2','madlib.avg',10,0.001) 

我的表名是sample_sordetail

我遇到了错误:

错误:xx000:plpy.error:kmeans错误:数据表不存在! (plpython.c:4648(

请建议如何解决此问题。

madlib_kmean请检查kmean_random参数定义。rel_source->文本。您需要在此处放置表名。"从...中选择……"不是桌子。您应该能够在此Madlib网站上找到该教程。

经常挣扎后,我必须知道错误是由于数据格式引起的。Mprice列应具有类型点双精度[]。参考http://madlib.incubator.apache.org/docs/master/group_grp__kmeans.html

将mprice更改为双重精度后,我能够在数据集上执行KMean算法。

相关内容

  • 没有找到相关文章

最新更新