Hadoop的机器学习框架



除了Mahout之外,还有哪些框架可以在JAVA中实现机器学习算法,从而使底层框架采用JAVA代码并在Hadoop上运行?

我正在寻找Mahout的替代方案,因为我需要一个SVM和Hadoop上的聚集聚类实现,而Mahout只支持SVM。

我推荐你们使用基于Apache Hadoop的机器学习/数据挖掘库,比如Apache Mahout。

http://www.openankus.org/pages/viewpage.action?pageId=2195722

它是如此简单和容易的mapreduce作业处理。你感兴趣吗?查看更多wiki(http://www.openankus.org)

好吧,如果SVM在hadoop上,那么剩下的就很容易实现了!

注意,朴素聚集聚类算法对于大数据(O(n^2)复杂度)是无效的。这种复杂性使得算法不可能在大型数据集上运行,即使是在大型集群上,除非您尝试它的扩展,如ftp://193.167.42.127/franti/papers/GraphPnn-TPAMI.pdf

模式。它有一个Java API,您也可以使用R。

http://www.cascading.org/pattern/

快速谷歌搜索得到以下

http://java-ml.sourceforge.net/-在将近3年后,有一个释放。不确定它的支持程度以及实现了什么算法。

http://sourceforge.net/projects/weka/-其他人最近提出的一些建议看起来不错。

另请参阅此线程。

这两种都没试过

相关内容

  • 没有找到相关文章

最新更新