为大约30 TB的数据选择Graph DB时需要考虑哪些因素



我正在开发一个软件系统(图形数据库),以研究多个组件之间的互连。它最终可能会有大约30 TB的数据。我想知道在选择正确的数据库时要考虑哪些因素。

我正在寻找的一些选项是Apache Giraph、TitanDB。我还想知道像neo4j或OrientDB这样的较小规模的DB本身是否可以工作

这是一个非常宽泛的问题,所以我会准确地定义您想要的内容,因为大小可能有点模糊。

我认为您提供的任何一个示例图dbs都可以对这么大的数据进行建模。

你可以问自己一些"更详细"的问题,包括:

  1. 你关心水平缩放吗如果是,那么您应该查看TitanDB、OrientDB或DSE Graph,因为Neo4J(在撰写本文时)不会水平扩展,因此受服务器大小的限制
  2. 标准化语言查询/遍历语言是否重要如果是,那么您可能应该更多地关注Tinkerpop供应商,如TitanDB、OrientDB、DSE Graph和其他供应商。如果没有,那么任何选择都适合你
  3. 我的数据有超级节点吗如果是,那么您应该了解每个供应商如何处理超级节点。一些供应商使用shard,另一些则使用巧妙的图形分区算法
  4. 你想要多少支持如果您需要很多,那么也许您应该考虑强大的企业解决方案,如DSE、OrientDB或Neo4J。Neo4J目前被认为是最受欢迎的图形数据库,随之而来的是大量的支持
  5. 你想使用开源软件吗如果是,那么TitanDB、Neo4j或OrientDB可能适合您

这些只是在所有供应商之间做出更好决策时可以考虑的一些事情注意:您可以考虑许多其他供应商,Blazegraph、HypergraphDB等等。

最新更新