我正在尝试使用spaCy解析句子,我想忽略比较,但我不知道如何做到这一点。
例如,如果我有句子Java, unlike C, has a garbage collector
。
我只想要";Java";根据上下文将其识别为句子中所涉及的NER。
如果我的头衔被取消了,我很抱歉,我目前正在尝试NER,但也许我需要其他东西?
仅使用NER将不允许执行此操作。
通过将解析器与NER结合使用,您应该能够识别句子的主题(nsubj
(,这些单词似乎是您感兴趣的单词。
不过,你需要使用一个好的模型。我用en_core_web_trf
在你的评论中给出的例子得到了很好的结果。