我想获得nltk树中节点的父节点和子节点。我在这里看到了这个答案,但我无法将其符合我的目的。
例如,拥有以下树:
ROOT
|
S
_______|______________
| VP |
| ___|____ |
NP | ADJP |
| | ____|____ |
PRP VBZ RB JJ .
| | | | |
It is so nice .
我从其他答案中提取并修改了这个代码,这些答案提供了一些信息,但不是我想要的。
ptree = ParentedTree.fromstring('(ROOT (S (NP (PRP It))
(VP (VBZ is) (ADJP (RB so) (JJ nice))) (. .)))')
leaf_values = ptree.leaves()
ptree.pretty_print()
if 'nice' in leaf_values:
leaf_index = leaf_values.index('nice')
print(leaf_index)
tree_location = ptree.leaf_treeposition(leaf_index)
print(tree_location)
print(ptree[tree_location])
print(tree_location[:-1])
print(ptree[tree_location[:-1]])
print(tree_location[:-2])
print(ptree[tree_location[:-2]])
3
(0, 1, 1, 1, 0)
nice
(0, 1, 1, 1)
(JJ nice)
(0, 1, 1)
(ADJP (RB so) (JJ nice))
我想实现以下内容。假设我的位置/节点为"nice"。我想做一个函数,这样当我输入"nice"的位置作为参数时,我就能得到"JJ"的位置。类似于get_parent(positionOf('nice'))返回positionOf('JJ')。然后我可以执行get_parent(positionOf('JJ')),它返回positionOf('ADJP')等
我还想得到一个节点的子节点,例如,如果我有get_childs(positionOf('ADJP')),它应该返回position('RB')和position of('JJ')。
有人知道我该如何实现吗?你能举一个小例子吗?
叶的父级:打印(ptree[tree_location[:-1]].label())
始祖:print(ptree[tree_location[:-2]].label())