我正在尝试将数据加载到 Allegro Graph 服务器中,其中一个参数是 --with-indices
。谁能解释一下它是关于什么的?
我已经阅读了整个 Allegro Graph 文档,其中提到索引可以是spogi
、sopgi
等,但没有提到它们是关于什么的。
请准确解释。(我不要求完整的spogi
、sopgi
等形式。我想要的是它们的确切含义。
三元组存储包含三元组spo
(主语、谓词、宾语)。针对如此存储的图形的查询可能必须遍历大量图形才能找到与查询匹配的节点。AllegroGraph 可以存储使遍历速度更快的索引:例如,查找首先匹配的所有谓词以及附加的主语和宾语节点,它可以使用首先查找谓词的索引pso
。如果您的三元组具有命名图形,则可以添加g
并且所有三元组的 id 都i
。所以AG可以使用索引psogi
。(来自文档:AllegroGraph Triple Index)
AG 三元组存储是使用一组默认索引创建的。生成专用索引会占用大量资源,但如果您知道将要获得哪种查询,您可能会发现指定适当的索引以优化响应时间是值得的。
如果从命令行加载:
以下示例将单个文件加载到 AllegroGraph 中。
./agload --with-indices "ospgi,posgi,spogi" 三重存储将生成三个三重索引:ospgi、posgi 和 spogi。
(来自agload
文档)
如果您使用的是 REST 接口,则可以使用指定的索引创建存储库:
放置/存储库/[名称]
参数 index
:
指数 可以指定任意次数。应保存索引 ID,并且 用于配置为存储创建的索引集。
(来自put repo
文档)
或者你可以加载你的三元组,然后做:
PUT/repository/[name]/index/[type] 确保索引 按类型指示 存在于此商店中。提交时生效 时间(当然,当使用共享后端或 自动提交会话)。
(来自put index
文档)