如何生成元组集的传递闭包



生成一组元组的传递闭包的最佳方法是什么?

例:

  • 输入Set((1, 2), (2, 3), (3, 4), (5, 0))
  • 输出Set((1, 2), (1, 3), (1, 4), (2, 3), (2, 4), (3, 4), (5, 0))
//one transitive step
def addTransitive[A, B](s: Set[(A, B)]) = {
  s ++ (for ((x1, y1) <- s; (x2, y2) <- s if y1 == x2) yield (x1, y2))
}
//repeat until we don't get a bigger set
def transitiveClosure[A,B](s:Set[(A,B)]):Set[(A,B)] = {
  val t = addTransitive(s)
  if (t.size == s.size) s else transitiveClosure(t)
}
println(transitiveClosure(Set((1,2), (2,3), (3,4))))

这不是一个非常有效的实现,但它很简单。

unfold的帮助下,

def unfoldRight[A, B](seed: B)(f: B => Option[(A, B)]): List[A] = f(seed) match {
  case Some((a, b)) => a :: unfoldRight(b)(f)
  case None => Nil
}
def unfoldLeft[A, B](seed: B)(f: B => Option[(B, A)]) = {
  def loop(seed: B)(ls: List[A]): List[A] = f(seed) match {
    case Some((b, a)) => loop(b)(a :: ls)
    case None => ls
  }
  loop(seed)(Nil)
}

它变得相当简单:

def transitiveClosure(input: Set[(Int, Int)]) = {
    val map = input.toMap
    def closure(seed: Int) = unfoldLeft(map get seed) {
        case Some(`seed`) => None
        case Some(n)      => Some(seed -> n -> (map get n))
        case _            => None
    }
    map.keySet flatMap closure
}

另一种写法是这样的closure

def closure(seed: Int) = unfoldRight(seed) {
    case n if map.get(n) != seed => map get n map (x => seed -> x -> x)
    case _ => None
}

不确定我自己最喜欢哪种方式。我喜欢测试Some(seed)以避免循环的优雅,但是,出于同样的原因,我也喜欢映射map get n结果的优雅。

这两个版本都不返回循环seed -> seed,因此如果需要,您必须添加它。这里:

    def closure(seed: Int) = unfoldRight(map get seed) {
        case Some(`seed`) => Some(seed -> seed -> None)
        case Some(n)      => Some(seed -> n -> (map get n))
        case _            => None
    }

将问题建模为有向图,如下所示:

将元组中的数字表示为图形中的顶点。然后每个元组 (x, y) 表示从 x 到 y 的有向边。之后,使用Warshall算法找到图的传递闭包。

对于生成的图形,然后将每个有向边转换为 (x, y) 元组。这就是元组集的传递闭包。

假设您拥有的是 DAG(示例数据中没有循环),则可以使用以下代码。 它期望 DAG 作为从 T 到 List[T] 的映射,您可以使用以下命令从输入中获取

input.groupBy(_._1) mapValues ( _ map (_._2) )

这是传递闭包:

def transitiveClosure[T]( dag: Map[ T, List[T] ] ) = {
  var tc = Map.empty[ T, List[T] ]
  def getItemTC( item:T ): List[T] = tc.get(item) match {
    case None =>
      val itemTC = dag(item) flatMap ( x => x::getItemTC(x) )
      tc += ( item -> itemTC )
      itemTC
    case Some(itemTC) => itemTC
  }
  dag.keys foreach getItemTC
  tc
}

此代码仅计算一次每个元素的闭包。 然而:

  • 如果通过 DAG 的路径足够长,则此代码可能会导致堆栈溢出(递归不是尾递归)。
  • 对于一个大图,如果你想要一个不可变的 Map,你可能最好让 tc 成为一个可变的 Map,然后在最后转换它。
  • 如果您的元素确实是小整数(如您的示例所示),则可以通过使用数组而不是 Map 来显着提高性能,尽管这样做会使某些事情复杂化。

若要消除堆栈溢出问题(对于 DAG),可以执行拓扑排序、反转拓扑排序并按顺序处理项。 但另请参阅此页面:

最著名的图传递闭包算法

最新更新