基于从不同边的特性导出的信息过滤边

  • 本文关键字:信息 过滤 gremlin tinkerpop3
  • 更新时间 :
  • 英文 :


我正试图使用Tinkerpop3将列车时刻表表示为图形。图表的节点是火车站,边缘是"时间表元素",包含火车从一个车站到另一个车站的所有信息。我目前正在努力制定一个图形查询,以找到在不同边的属性导出的时间窗口内与离开车站的列车相对应的所有边。

为了说明我试图解决的问题,我设置了一个小玩具图:

graph = TinkerGraph.open()
g = graph.traversal()
g.addV().property('name', 'London Euston').
addV().property('name', 'Milton Keynes').
addV().property('name', 'Stoke-on-Trent').
addV().property('name', 'Stockport').
addV().property('name', 'Manchester Piccadilly')
schedule = [['London Euston', 'Milton Keynes', 
'T1', 1509537600000, 1509539400000],
['Milton Keynes', 'Stoke-on-Trent', 
'T1', 1509539460000, 1509541200000],
['Stoke-on-Trent', 'Stockport', 
'T1', 1509541260000, 1509543000000],
['Stockport', 'Manchester Piccadilly', 
'T1', 1509543060000, 1509544800000],
['London Euston', 'Milton Keynes', 
'T2', 1509537900000, 1509540000000],
['Milton Keynes', 'Stoke-on-Trent', 
'T2', 1509540060000, 1509542100000],
['Stoke-on-Trent', 'Stockport', 
'T2', 1509542160000, 1509544200000],
['Stockport', 'Manchester Piccadilly', 
'T2', 1509544260000, 1509546600000],
['London Euston', 'Milton Keynes', 
'T3', 1509548400000, 1509550200000],
['Milton Keynes', 'Stoke-on-Trent', 
'T3', 1509550260000, 1509552000000],
['Stoke-on-Trent', 'Stockport', 
'T3', 1509552060000, 1509553800000],
['Stockport', 'Manchester Piccadilly', 
'T3', 1509553860000, 1509555600000]]
for(scheduleInfo in schedule)
{
v1 = g.V().has('name', scheduleInfo[0]).next()
v2 = g.V().has('name', scheduleInfo[1]).next()
v1.addEdge('Schedule', v2, 
'trainID', scheduleInfo[2], 
'outTime', scheduleInfo[3], 
'inTime', scheduleInfo[4])
}

这张图表由三列从伦敦开往曼彻斯特的列车组成。边缘有三个特性:

  • trainID:列车ID
  • outTime:出站节点发车时间
  • inTime:到达传入节点的时间

所有时间都存储为以毫秒为单位的UNIX时间戳。我想从我的图表中找到的一件事是:

对于列车"T1"离开的所有车站,还有哪些列车也离开这些车站

这是一个相当简单的Gremlin查询

g.E().has('trainID','T1').as('e1').
outV().as('station').outE().as('e2').
path().by('trainID').by('name')

我现在正在努力解决的问题,也是这篇文章的灵感来源,如下所示:

对于"T1"列车离开的所有车站,有多少列车在列车"T1"的正负15分钟内离开同一车站

到目前为止,我能想出的最接近的答案是:

g.E().has('trainID','T1').as('e1').
outV().as('station').
outE().as('e2').
path().
filter{it.get().e2.outTime > (it.get().e1.outTime - 60*15*1000L)}.
filter{it.get().e2.outTime < (it.get().e1.outTime + 60*15*1000L)}

这个查询得到了我想要的所有路径,但它使用了lambda步骤,TinkerPop3文档明确不鼓励这样做。我想知道是否有另一种不使用lambda步骤的编写此查询的方法。如有任何帮助,我们将不胜感激。

基本查询为:

g.E().has('trainID','T1').
sack(assign).
by('outTime').
outV().as('station').
outE().has('trainID', neq('T1')).
sack(minus).
by('outTime').
filter(sack().is(between(-60*15*1000L, 60*15*1000L)))

添加一些路径标签以创建更可读的输出:

gremlin> g.E().has('trainID','T1').as('e1').
sack(assign).
by('outTime').
outV().as('station').
outE().has('trainID', neq('T1')).as('e2').
sack(minus).
by('outTime').
filter(sack().is(between(-60*15*1000L, 60*15*1000L))).
select('station','e1','e2').each {
println "${it.get('station').value('name')}"
println "* T1 departure: ${new Date(it.get('e1').value('outTime'))}"
println "* ${it.get('e2').value('trainID')} departure: ${new Date(it.get('e2').value('outTime'))}n"
}; []
London Euston
* T1 departure: Wed Nov 01 05:00:00 MST 2017
* T2 departure: Wed Nov 01 05:05:00 MST 2017
Milton Keynes
* T1 departure: Wed Nov 01 05:31:00 MST 2017
* T2 departure: Wed Nov 01 05:41:00 MST 2017
Stoke-on-Trent
* T1 departure: Wed Nov 01 06:01:00 MST 2017
* T2 departure: Wed Nov 01 06:16:00 MST 2017

最新更新