从NLTK中的句子中提取关系



我正在使用nltk提取一个人与组织之间的关系。

另外,我想提取组织和位置之间的关系。NLTK版本为3.2.1。

我使用了词性标记和命名实体识别(NER)。还为NER结果绘制了解析树。
但是我无法从该句子中提取上述关系。

这是代码:

import nltk, re
from nltk import word_tokenize
sentence = "Mark works at JPMC in London every day"
pos_tags = nltk.pos_tag(word_tokenize(sentence))            # POS tagging of the sentence
ne = nltk.ne_chunk(pos_tags)                                # Named Entity Recognition
ne.draw()                                                   # Draw the Parse Tree
IN = re.compile(r'.*binb(?!b.+ing)')
for rel1 in nltk.sem.extract_rels('PER', 'ORG', pos_tags, pattern = IN):
    print(nltk.sem.rtuple(rel1))
for rel2 in nltk.sem.extract_rels('ORG', 'LOC', pos_tags, pattern = IN):
    print(nltk.sem.rtuple(rel2))


如何提取'人 - 组织'关系和'组织 - 位置'关系?

我认为文档不是标记的pos,应该是ne。

工作代码

senten = "Mark works in JPMC in London every day"
pos_tags = nltk.pos_tag(word_tokenize(senten))  # POS tagging of the sentence
ne = nltk.ne_chunk(pos_tags)  # Named Entity Recognition
chunked = nltk.ne_chunk_sents(pos_tags, binary=True)
# ne.draw()  # Draw the Parse Tree

print(pos_tags)
IN = re.compile(r'.*binb(?!b.+ing)')
for rel in nltk.sem.extract_rels('PERSON', 'ORGANIZATION', ne, corpus='ace', pattern=IN):
    print(nltk.sem.rtuple(rel))

输出

[per:'mark/nnp']'works/vbz in/in in'[org:'jpmc/nnp']

最新更新