r-回溯树的两列数据的父级/路径



我有一个像下面这样序列化的树数据:关系:P对C是"一对多",C对P是"一比一"。所以列P可能有重复的值,但列C有唯一的值。

P, C
1, 2
1, 3
3, 4
2, 5
4, 6
# in data.frame
df <- data.frame(P=c(1,1,3,2,4), C=c(2,3,4,5,6))

1.如何有效地实现函数func,以便:

CCD_ 2向根(在这种情况下为1(返回完整路径的向量。

例如:

func(df, 3) returns c(1,2,3)
func(df, 5)  returns c(1,2,5)
func(df, 6) returns c(1,3,4,6)

2.或者,将df快速转换为这样的查找表也适用于我:

C, Paths
2, c(1,2)
3, c(1,3)
4, c(1,3,4)
5, c(1,2,5)
6, c(1,2,4,6)

以下是使用igraph的解决方案

library(igraph)
g <- graph_from_data_frame(df)
df <- within(df,
Path <- sapply(match(as.character(C),names(V(g))), 
function(k) toString(names(unlist(all_simple_paths(g,1,k))))))

使得

> df
P C       Path
1 1 2       1, 2
2 1 3       1, 3
3 3 4    1, 3, 4
4 2 5    1, 2, 5
5 4 6 1, 3, 4, 6

最新更新