我编写了一个工作流分发平台,主要用于不同文件类型的文本提取。它的工作原理是处理一个文件,然后在该文件中所有可提取文本的嵌入项上递归。创建的每个工作项都由GUID唯一标识,并且还具有父GUID。对于没有嵌入项的文件,辅助项GUID和父项GUID相等。如果文件具有嵌入项,则为每个嵌入项创建一个工作项,该工作项具有唯一的GUID,并且其父GUID等于文件的GUID。例如,Outlook邮件文件可以包含附件,而附件又可能包含嵌入项目(即在Word文档中插入电子表格)。
我想提供一个接口,当原始文件处理中的任何项目的递归完成时,该接口将向客户端发送通知。我已经写了一个树结构来做我想做的事,但它看起来有点糟糕和天真。有没有一个已知的模式或库可以提供我上面概述的内容?
您可以使用四叉树和四叉键。四叉键通常用于地图应用程序,但使用四叉键也可以按不同的顺序对树进行排序。当您希望分布式并行进程分配给特定的核心时,它可以帮助它们。