我们的团队是Gelly api的新手。我们正在寻求实现一个简单的用例,该用例将列出源自初始垂直线的所有路径,例如
输入边缘csv文件为1,2\n2,3\n3,4\n15\n5,6
所需输出为(从1开始的完整路径)1,2,3,4\n1,5,6
有人能帮忙吗。
您可以使用Gelly的迭代抽象之一,例如以顶点为中心的迭代。从源顶点开始,可以迭代地扩展路径,每个超级步骤一跳。接收到路径后,顶点会将其ID附加到路径上,并将其传播给传出的邻居。如果顶点没有传出的邻居,则会打印/存储路径,并且不会进一步传播。为了避免循环,顶点还可以在传播之前检查其ID是否存在于路径中。计算函数可能如下所示:
public static final class ComputePaths extends ComputeFunction<Integer, Boolean, NullValue, ArrayList<Integer>> {
@Override
public void compute(Vertex<Integer, Boolean> vertex, MessageIterator<ArrayList<Integer>> paths) {
if (getSuperstepNumber() == 1) {
// the source propagates its ID
if (vertex.getId().equals(1)) {
ArrayList<Integer> msg = new ArrayList<>();
msg.add(1);
sendMessageToAllNeighbors(msg);
}
}
else {
// go through received messages
for (ArrayList<Integer> p : paths) {
if (!p.contains(vertex.getId())) {
// if no cycle => append ID and forward to neighbors
p.add(vertex.getId());
if (!vertex.getValue()) {
sendMessageToAllNeighbors(p);
}
else {
// no out-neighbors: print p
System.out.println(p);
}
}
else {
// found a cycle => print the path and don't propagate further
System.out.println(p);
}
}
}
}
}
在这段代码中,我假设您已经预处理了顶点,以便用"true"值标记那些没有外邻居的顶点。例如,您可以使用graph.outDegrees()
来查找这些。
请记住,在一个大而密集的图中枚举所有路径的计算成本很高。中间路径状态可以很快爆发。您可以考虑使用比使用整数的ArrayList更紧凑的方式来表示路径,但如果您有一个大直径的密集图,请注意成本。如果你不需要路径本身,但只对可达性或最短路径感兴趣,那么就有更有效的算法。