LAMP聚类分析



我正在寻找一种方法来进行一些数据集群分析。这是我无法做到的,但我知道这是可以做到的。我正在寻找将我所拥有的数据进行聚类并以可视化的方式呈现的方法。我想到的是一个树状图,但我也愿意接受其他建议。

是否有任何已经编写的脚本或类能够帮助我完成这项任务?我更喜欢呆在LAMP里。

谢谢。

我所知道的最完整的开源工具是用于文档集群的carrot2开源框架。它们主要以java和.NET为中心,但可以通过REST接口与Ruby和PHP5一起使用。应该相对容易集成到您选择使用的任何框架中。

这是他们的主页-http://project.carrot2.org/index.html

这是他们的集群引擎和可视化的在线演示,圆圈可视化可能会让你感兴趣(一旦你输入查询,就会有3个视觉输出选项卡,它是中间的一个)-http://search.carrot2.org/stable/search

这是他们的商业产品,lingo3g-http://search.carrotsearch.com/carrot2-webapp/search。它对大多数查询的聚类速度快6-8倍,提供不同(更好?)的结果聚类,并提供分层聚类和相应的可视化。如果你想使用它,你可以请求试用,你可以给他们发一封电子邮件,他们会让你访问所有相应的材料(作为carrot2开源下载),并获得2个月的试用许可。

如果这不是您想要的,并且您只想要一个原始的库集合,那么您也可以查看apache的mahout项目。

相关内容

  • 没有找到相关文章

最新更新