如何预测加权有向图网络上的边/链路/连接



给定加权有向图的邻接矩阵A(因此矩阵元素不只是0/1,矩阵不是对称的),有什么好的方法可以预测新边吗?

我有一个非常大(数十亿个节点)的数据集,其中一些连接有已知的边,未观察到的连接有NULL值,我想使用已知的边来预测未观测到的边。

如果方法不精确,那也没关系——事实上,如果预测低于某个阈值,我希望保持边为NULL或0,只是为了在数据大小和处理速度方面保持矩阵尽可能稀疏。

有什么想法吗?

您可能希望深入研究随机图生成和图挖掘文献,尤其是在无标度网络上的工作。在互联网上快速搜索一下,就发现了一些可能具有相关性的论文。

  • 概述了真实世界的动态网络,包括它们的特性、合适的模型和分析技术。

  • 关于无标度网络的开创性论文。

  • 这篇综述文章的重点是可用于合成图生成的真实图的性质。

  • 本文讨论了作者声称在大型真实世界图形中经常出现的致密化和缩径问题。列举了测试用例。

  • 本文主要研究合成社交网络图的生成。

将给定的参考文献视为有点武断的选择。我期待大量相关的资源。

我自己的一些粗略的高层想法:你有关于实际图的(统计)属性、权重的聚合度量或它们的统计分布的信息吗?你有关于你的抽样策略(特别是偏倚)的属性的信息吗?你的观察有时间标记吗?

如果你有一个统计模型,看看最大似然估计。如果到目前为止你只观察到了连接,并且你可以假设它们是iid,你可以将bootstrap方法应用于你的观测集,以估计图属性的统计信息(例如,度/连通性/周长/权重等的均值/方差等)。根据所讨论的度量,这条轨迹可能有些过头了——假设你的观测集中没有偏差,而是根据给定的图计算度量。

将这些信息输入到一个随机图生成器中,该生成器允许使用启动图进行初始化。

希望这份大纲能有所帮助,尽管它迷雾重重。致以最良好的祝愿。

最新更新