在使用 LOAD CSV 时在数组中的每个节点之间创建关系



我有一个给定的CSV文件:

1,2016-10-09T21:14:44Z,Anna Long,"[{"_id": "1", "objectType": "primaryTag"}]"
2,2016-10-10T14:03:51Z,Jonathan Collier,"[{"_id": "2", "objectType": "primaryTag"}, {"_id": "3", "objectType": "secondaryTag"}]"
3,2016-10-09T21:42:35Z,Michelle Wheeler,"[{"_id": "4", "objectType": "primaryTag"}, {"_id": "5", "objectType": "secondaryTag"}, {"_id": "6", "objectType": "secondaryTag"}]"

现在,我尝试从CSV文件中的JSON数组创建节点和关系。 我可以使用以下命令导入 CSV 文件:

LOAD CSV FROM file:///<my_file> AS row 

此外,我能够使用此查询获取 JSON 数组:

WITH apoc.convert.fromJsonList(row[3]) AS tags

现在,我想分别为 CSV 文件中的每一行在 JSON 数组中的每个标签之间创建一个关系。

因此,作为示例,让我们从CSV文件中获取第三行。我们在 JSON 数组中有 3 个对象,因此我想创建 3 个关系。ID 为 4&5、4&6 和 5&6 的标签之间的关系。

可悲的是,我完全被困在这里,不确定我是否必须与UNWINDFOREACH合作。

编辑

我解决了如下问题(所有相关节点都已导入到数据库中(:

LOAD CSV FROM file:///<my_file> AS row 
MATCH (q:Question {id: row[0]})--(t1:Tag)
WITH COLLECT(t1) AS tags, row[0] AS question_id
FOREACH (i IN range(0, size(tags) - 2) |
FOREACH (node1 IN [tags[i]] | 
FOREACH (j IN range(i+1, size(tags) - 1) | 
FOREACH (node2 IN [tags[j]] | 
MERGE (node1)-[c:CONNECTED_TO]-(node2)
)
)
)
)

代码有效,但它有 4 个 FOREACH 循环。我仍然相信有一种更美丽的方法。所以请随时回答我的问题。

首先要意识到的是,您还没有可以使用的节点,您只有对象。您需要转换与这些节点关联的节点(匹配、合并或创建(。

让我们以最简单的情况为例,每次都创建新节点,并设置所有属性

LOAD CSV FROM file:///<my_file> AS row 
WITH apoc.convert.fromJsonList(row[3]) AS tags
UNWIND tags as tag
CREATE (t:Tag)
SET t = tag // assigns map properties to node properties
WITH row, collect(t) as tagNodes
CALL apoc.nodes.link(tagNodes, 'REL')
RETURN count(*)

我正在使用 APOC 程序中的apoc.nodes.link()轻松地在列表中的所有节点之间创建关系。但是,如果您没有 APOC 或无法使用它,则必须使用一些替代方法。

请参阅这篇关于在Cypher中创建和使用链表的知识库文章

编辑

所以我错过了关于你想要在所有节点组合之间创建关系的部分,而不仅仅是通过它们的所有链表。

我们可以使用apoc.coll.combinations()来获取列表中 2 个节点的每个组合,并在它们之间创建关系:

LOAD CSV FROM 'file:///<my_file>' as row
WITH row, apoc.convert.fromJsonList(row[3]) AS tags
UNWIND tags as tag
CREATE (t:Tag)
SET t = tag // assigns map properties to node properties
WITH row, collect(t) as tagNodes
UNWIND apoc.coll.combinations(tagNodes, 2) as pair
WITH pair[0] as start, pair[1] as end
CREATE (start)-[:REL]->(end)

最新更新