我正在导入一个重要大小的文件,作为 orientdb 11M 边缘与 20000 个节点上的图形。 而且白费了太多时间。 有没有办法优化图形负载或探索 16G 机器的最大性能。
我的问题是为什么需要很多时间? 其次,我该如何优化呢?
快速导入的一些建议:
- 如果可以,请使用
plocal
连接 - 使用事务连接并批量提交 ~500 条记录
- 尽量避免频繁重新加载顶点。大多数情况下,插入新边的大部分时间都花在了寻找两个顶点上。
- 如果你的图表不是很大,用例足够简单,你可以尝试看看这个 http://orientdb.com/docs/2.2.x/Graph-Batch-Insert.html
- 如果您主要关心的是插入速度,OrientDB ETL 不是最佳选择,请使用一些自定义 Java 代码