有人知道评估三重存储推理性能的基准吗?我正在使用Stardog,它使用Pellet作为推理引擎,并寻找一个基准来评估推理性能。
如果没有,那么对于如何进行评估,我们将不胜感激。
谢谢。
LUBM可能是最标准的基准。LDBC正在为推理基准做一些工作,但最终来看,它还没有经过深思熟虑,仍处于早期阶段。
与所有基准一样,要小心过度依赖基准结果。真正告诉你的是,一个特定的系统在这个基准上很好。通常,它可能表示性能,也可能不是。除非您试图在基准上构建,否则您应该考虑如何使用自己的数据和查询创建基准,以反映您自己的实际用例。
您还应该注意不同推理实现的特点,特别是物化与查询重写的含义,并在解释结果时将其考虑在内。