>我正在使用可怕的系统,该系统已经实现了目录树结构并支持以"奇怪的方式"导入此结构,因为 导入仅支持格式child;parent
。 导入约束:
- 子项必须具有唯一的名称
- 如果父项重复,则在找到的第一个父项下导入子项
假设要创建的目录结构如下
root
|-- A
| |-- aa
| | |-- cc
| | `-- dd
| `-- bb
| `-- ee
`-- B
|-- aa
| |-- cc
| `-- dd
`-- bb
`-- FF
默认导入的外观如何,它不起作用或产生错误的表示形式:
child;parent
root
A;root
aa;A
cc;aa
dd;aa
bb;A
ee;bb
B;root
aa;B <-- duplicated child item does not work
cc;aa <-- duplicated entry - system saves it under A instead of under B
dd;aa <-- duplicated entry - system saves it under A instead of under B
bb;B
FF;bb <-- system saves it under A instead of under B
错误的表示
root
|-- A
| |-- aa
| | |-- cc
| | `-- dd
| `-- bb
| |-- FF
| `-- ee
`-- B
`-- aa
|-- cc
`-- dd
为了解决这个问题,我决定用唯一的字符串重命名每个文件夹=id
+ 其他更改(更短的名称等以适应系统要求) 并将其导入系统,然后通过数据库删除=id
。
然后导入对如下所示:
child;parent
root;
A==1;root=0
aa=2;A=1
cc=3;aa=2
dd=4;aa=2
bb=5;A=1
ee=7;bb=3
B=8;root=0
aa=9;B=8
cc=10;aa=9
dd=11;aa=9
bb=12;B=8
FF=13;bb=12
并且结构符合要求
root=0
|-- A=1
| |-- aa=2
| | |-- cc=3
| | `-- dd=4
| `-- bb=5
| `-- ee=7
`-- B=8
|-- aa=9
| |-- cc=10
| `-- dd=11
`-- bb=12
`-- FF=13
但是,我需要在不重命名的情况下使用原始结构。
我有一个想法,我可以使用树数据结构将结构仅保留在内存中,但我在实现中陷入困境。
我想使用os.walk('root')
和treelib
但我需要帮助来实现这一点。
所有提示都非常感谢。 谢谢
所以这里的问题是,在你的系统中,目录的所有名称似乎都在同一个范围内。如果不重命名文件夹,这是无法解决的。但是,我的方法是在名称中对父结构进行编码,而不仅仅是索引每个文件夹。对于您的示例,您的代码将如下所示:
child;parent
root
root/A;root
root/A/aa;root/A
root/A/aa/cc;root/A/aa
...
root/B;root
root/B/aa;root/B <-- not duplicated anymore.
...
但是,这种方法可能存在问题,因为目录名称可能会变得非常长。您对系统有什么访问权限,可以修改它吗?如果我理解正确,它是用于创建文件夹结构的?那么系统似乎不支持在具有相同名称的不同目录中拥有子目录。如果您使用 bash 生成导入文件(从已经存在的目录结构),我提出的方法很容易,因为命令pwd
为您提供目录的绝对路径。
如果您有权修改系统,解决方案是在每个文件夹节点中都有一个字典(以避免名称冲突),然后具有以下导入文件:
child;parent
root
A;root
aa;root/A
cc;root/A/aa
...
B;root
aa;root/B
...
因此,您只有子项的名称,然后是父项中的显式路径。然后,您可以从根沿父路径遍历以查找父节点。
我找到了如何为原始目录和重命名目录提供引用的方法
我使用了treelib
,因为每个node
都可以包含tag, identifier, data
, 并通过方法扩展treelib.Tree
create_from_path
。
对于此路径:root/A/bb/cc/dd
然后将给定的路径root/A/bb/cc/dd
分成几部分并访问每个节点 + 更新(如果已经存在): 使用此模板:treelib.Node(tag=unique_name, identifier=full_path, data=base_name)
root
->Node(root=1, root, root)
root/A
->Node(A=2, root/A, A)
root/A/bb
->Node(bb=3, root/A/bb, bb)
root/A/bb/cc
->Node(cc=4, root/A/bb/cc, cc)
root/A/bb/cc/dd
->Node(dd=5, root/A/bb/cc/dd, dd)
然后我可以遍历树并构建所需的路径,例如:root=1/A=2/bb=3/cc=4/dd=5