NOSQL具有分析功能



我正在搜索支持分析功能( AF for Short)的任何NoSQL系统(最好是开源),例如Oracle/SQL Server/Postgres所做的。我没有发现任何具有建筑功能的功能。我已经阅读了有关Hive的一些内容,但它没有AF(Windows,First_last值,NTILES,LAG,LEAD等)的实际功能,而只是直方图和NGrams。还有一些NOSQL系统(例如Redis)支持地图/降低,但是我不确定AF是否可以用它代替。

我想进行性能比较以选择Postgres或Nosql System。

所以,简而言之:

  1. 使用AF搜索NoSQL系统
  2. 我可以依靠地图/减少替换AF吗?它快速,可靠,易于去吗?

ps。我试图使我的问题更具建设性。

一旦您真正了解了MapReduce的工作原理,就可以使用几行代码来完成令人惊奇的事情。

这是一个不错的视频课程:

http://code.google.com/intl/fr/edu/submissions/mapreduce-minilecter/listing.html

真正的困难因素将是您可以通过单个MapReduce实现的功能与需要链式MAPREDUCES的功能。此外,一些不错的MapReduce实现(例如CouchDB)不允许您链接MapReduces(轻松)。

某些函数在涉及某些聚合国王(AVG,中位数,标准偏差)或某些订购(首先,最后)时使用所有现有数据的知识。

如果您想要一个开箱即用的分布式NOSQL解决方案,则系统将需要依靠某些集中式索引和元数据来保留所有节点中有关数据的信息,从而有一个主节点,并且可能有一个单个节点失败点。

您必须询问使用NOSQL期望完成的事情。您想要示意表格吗?分布式数据?更简单查询的更好的原始性能?

根据您的需求,我在这里看到三个主要替代方案:

1-使用没有单个失败点(即:Cassandra)的分布式NOSQL来存储您的数据并使用MAP/RELAD来处理数据并为所需功能产生结果(几乎任何主要的NOSQL解决方案支持Hadoop)。需要注意的是,地图/减少查询不是实时的(可能需要数分钟或数小时才能执行查询),需要额外的设定和学习。

2-使用传统的RDBMS支持多个服务器,例如mysql cluster

3-使用NOSQL与主/从属拓扑一起使用,该拓扑支持诸如Mongo之类的临时和聚合查询

至于第二个问题:是的,您可以依靠M/R来替换AF。您几乎可以用m/r做任何事情。

相关内容

  • 没有找到相关文章

最新更新