扇出实体关系图数据库是什么意思



在Dgraph的论文中,提到实体是在服务器之间随机分片的,它们本身带有与其他实体的关系。这导致在图形查询的中间步骤中出现高扇出结果集,从而导致服务器上的广播和执行联接的高延迟。

我不明白在这里扇风的意思。

我试着从基础上理解,这就是我发现的:

  • 查询中的大量扇出请求可能会导致网络等问题拥塞、尾部延迟和CPU边界。点击此处查看论文
  • 扇入是对调用其他函数或方法(比如X(的函数或方法数量的度量。扇出是函数X调用的函数数。它用作基于调用图的度量。点击此处获取来源

我不确定以上到点与Dgraph论文中讨论的基于实体的图之间的关系。实体是否与其他实体有许多关系,因此一个实体有许多边?

简而言之:是的,在某些情况下,一个实体可能会有很多边附加到它上。

在第一篇论文中,shard是基于谓词"生活在";以及";吃";。在本说明书中;生活在";数据在一个碎片中;吃";数据在另一个碎片中,论文说:;假设最坏的情况是集群太大,每个碎片都位于一个单独的服务器上">

现在,考虑一个包含多个谓词的查询,每个谓词都在自己的shard中,并且每个shard都位于不同的服务器上。

Find any person 
that lives-in ???, 
that eats ???, 
that drinks ???,
that drives ???,
that reads ???

随着谓词的数量(即被查询的碎片的数量(的增长,我们看到了本文所描述的高度扇出。簇的数目";广播";显著增长,导致查询延迟按比例增长。

相关内容

最新更新